#2 Machine Learning - Cây quyết định và bài toán cơ bản từ gốc rễ



     Bạn có bao giờ tự hỏi bản thân về cách thức ta QUYẾT ĐỊNH về một vấn đề gì đó chưa? Bạn có tự hỏi cách thức bạn phải quyết định đi học, cách thức bạn quyết định đi chơi, cách thức bạn quyết định ngủ, làm thế nào bạn quyết định đọc DuongTech.com,... Thỉnh thoảng ta sẽ tìm được nhiều điều thú vị bằng cách đặt câu hỏi cho những điều lặp đi lặp lại trong cuộc sống của ta như một "thói quen". Bằng việc trả lời những điều đó bạn sẽ hiểu thêm về Machine Learning cũng như về Cây quyết định.

     Để quyết định điều gì chúng ta thường có những điều kiện cơ bản để so sánh với ý muốn của ta. Lấy ví dụ về việc quyết định bạn có muốn đọc DuongTech, bạn sẽ có nhưng điều kiện cụ thể như: đọc để lấy kiến thức, đọc để thư giản, đọc để lấy cảm hứng, đọc để chia sẽ lại,... Trong mỗi ý muốn đọc lại có những điều kiện khác để so sánh, ví dụ mục đích của bạn là "đọc để lấy kiến thức" bạn sẽ có hai cơ sở nữa là bài viết của DuongTech có phù hợp với bạn không, kiến thức đó có làm bạn thích thú không,...Mỗi phần ấy lại tạo ra những đặc điểm nửa để bạn đưa ra quyết định có nên đọc không. Điều này thấy đơn giản như một thói quen vô thức của ta nhưng thật phức tạp nhỉ!!! (Điều này cũng thôi thúc chúng tôi viết những bài Blog đáp ứng nhu cầu của mọi người nhiều hơn).





   Đúng vậy, để máy tính biết cách đưa ra những quyết định như con người thì chúng cũng tự tạo những điều kiện để so sánh quyết định như thế - Cây Quyết Định. Nhưng tôi muốn nói là máy tính không thông minh lắm đâu, chúng cần ta "dạy chúng đấy" ("ban phát trí tuệ") một cách thật sự tinh tế.

    Như bài viết trước tôi có đề cập đến Supervised Learning là cách dạy máy tính bằng những dự liệu, câu trả lời có sẵn để từ đó nó có thể dự đoán được kết quả trong các tính huống khác. Và sau đây là cách bạn có thể thử để giúp nó tạo cây quyết định và đoán thử một dữ liệu cơ bản nào đó mà bạn chưa đưa cho nó.


    Để hiểu hơn, trước mắt tôi sẽ kê ra một bảng số liệu PHÂN LOẠI HỌC SINH:


     Chúng ta sẽ thu thập thông tin từ một cơ quan hay một tổ chức nào đó để có được kết quả như trên. Sau đó tôi sẽ quy ước chúng về số theo cách sau:


     Trước tiên bạn phải install thư viện sklearn bằng cách mở cmd (Windows + R) và thử một trong 3 cách sau:
pip install sklearn
python -m pip install sklearn
py -m pip install sklearn

Sau đó bạn thêm phần code sau :
from sklearn import tree
my_tree = tree.DecisionTreeClassifier()

Tiếp theo hãy nhập mảng hai chiều cho phần đặc trưng và mãng một chiều cho phần nhãn nhé:

dactrung = [[ 3, 4, 5, 8],
            [4, 5, 1, 7],
            [4, 4, 1, 8],
            [5, 2, 4, 8],
            [3, 2, 1, 7],
            [5, 5, 4, 8],
            [4, 4, 1, 7],
            [3, 2, 5, 7]] # dữ liêu phần mô tả

nhan = [0, 0, 0 ,1 ,1 ,0 ,1 ,1] # dữ liệu phần phân loại

Và viết dòng này để bắt đầu ra lệnh "training" cho máy tính từ mảng mà bạn đã nhập vào, sau đó in ra kết quả nhé!!!!
result = my_tree.fit(dactrung, nhan) #thiết lập training
kq = result.predict([[4, 2, 1, 8]]) #đoán dữ liệu
print(kq) #in ra kết quả
Chúc các bạn may mắn!!!!!!

#2 Machine Learning - Cây quyết định và bài toán cơ bản từ gốc rễ #2 Machine Learning - Cây quyết định và bài toán cơ bản từ gốc rễ Reviewed by rack One brain on 9/01/2019 10:49:00 CH Rating: 5

Không có bình luận nào!

Được tạo bởi Blogger.
BACK TO TOP