Để xây dựng các bộ lọc thư rác dựa trên học máy, cần thu thập số lượng email đủ lớn đã được gán nhãn và chia tập email này thành hai tập: tập thứ nhất cho huấn luyện mô hình, tập thứ hai để kiểm thử mô hình. Hai tiêu chí sau để đánh giá mức độ sai số của một ứng dụng lọc email:
TC1= Số email rác trong hòm thư thường/Tổng số email trong hòm thư thường TC2 = Số email thường trong hòm thư rác/Tổng số email trong hòm thư rác Sau khi đọc nhận xét trên, một số bạn đã đưa ra các phát biểu dưới đây? (Các phát biểu đúng hay sai?)
Lời giải chi tiết
Để phân tích từng phát biểu, chúng ta cần xem xét các vấn đề liên quan trong quá trình lọc thư rác bằng học máy:
Chú ý khi giải