Trước khi đi vào bài này, bạn nên tham khảo các bài trước về Phân loại và hồi quy trong series Tự học ML. 

Phân loại và Hồi quy là hai vấn đề dự đoán chính thường được giải quyết trong Khai thác dữ liệu và ML.

  • Phân loại(Classification) là quá trình tìm kiếm hoặc khám phá một mô hình hoặc chức năng giúp tách dữ liệu thành nhiều lớp phân loại, tức là các giá trị rời rạc. Trong phân loại, dữ liệu được phân loại dưới các nhãn khác nhau theo một số tham số được đưa ra trong đầu vào và sau đó các nhãn được dự đoán cho dữ liệu.

Hàm ánh xạ dẫn xuất có thể được biểu diễn dưới dạng quy tắc “IF-THEN”. Quá trình phân loại giải quyết các vấn đề trong đó dữ liệu có thể được chia thành các nhãn nhị phân hoặc nhiều nhãn rời rạc.

Hãy lấy một ví dụ, giả sử chúng ta muốn dự đoán khả năng kết thúc trận đấu của Đội A trên cơ sở một số thông số đã ghi trước đó. Sau đó, sẽ có hai nhãn Có và Không.

Hình: Phân loại nhị phân và phân loại đa hình

  • Hồi quy là quá trình tìm kiếm một mô hình hoặc hàm để phân biệt dữ liệu thành các giá trị thực liên tục thay vì sử dụng các lớp hoặc các giá trị rời rạc. Nó cũng có thể xác định chuyển động phân phối tùy thuộc vào dữ liệu lịch sử. Bởi vì mô hình dự đoán hồi quy dự đoán một đại lượng, do đó, kỹ năng của mô hình phải được báo cáo là một lỗi trong các dự đoán đó

Chúng ta cũng hãy lấy một ví dụ tương tự trong hồi quy, trong đó chúng tôi đang tìm khả năng có mưa ở một số vùng cụ thể với sự trợ giúp của một số tham số được ghi lại trước đó. Sau đó, có một xác suất liên quan đến mưa.

Hình: Hồi quy ngày so với lượng mưa (tính bằng mm)

So sánh giữa Clasification(Phân loại) và Regression(Quy hồi):

THÔNG SỐPHÂN LOẠIHỒI QUY
Căn bảnChức năng ánh xạ cơ bản được sử dụng để ánh xạ các giá trị đến các lớp được xác định trước. Hàm ánh xạ được sử dụng để ánh xạ các giá trị tới đầu ra liên tục.
Liên quan đến dự đoán Các giá trị Rời rạcGiá trị liên tục
Bản chất của dữ liệu dự đoán không theo thứ tựCó thứ tự
Phương pháp tính toán bằng cách đo độ chính xác bằng phép đo sai số trung bình bậc hai
Thuật toán Ví dụVí dụ Cây quyết định, hồi quy logistic, v.v.Cây hồi quy (Rừng ngẫu nhiên), Hồi quy tuyến tính, v.v.

Cài ứng dụng cafedev để dễ dàng cập nhật tin và học lập trình mọi lúc mọi nơi tại đây.

Nguồn và Tài liệu tiếng anh tham khảo:

-->

Tài liệu từ cafedev:

Nếu bạn thấy hay và hữu ích, bạn có thể tham gia các kênh sau của cafedev để nhận được nhiều hơn nữa:

Chào thân ái và quyết thắng!

Đăng ký kênh youtube để ủng hộ Cafedev nha các bạn, Thanks you!