Thứ Bảy, 24 tháng 12, 2016

Tìm kiếm sự khôn ngoan từ Darwin tới Munger: Sự tin cậy của bằng chứng tình huống


TÁM


SỰ TIN CẬY CỦA BẰNG CHỨNG TÌNH HUỐNG


Các xác suất trước đó
Trên bàn ăn tối, John nói với Mary: “Một trong các nhân viên của chúng ta vừa bị bắt hôm nay vì ăn trộm, cô ta nói cô ta chưa bao giờ làm thế trước đây và sẽ không bao giờ tái phạm.”
Có bao nhiêu khả năng cô ta chưa bao giờ làm nó trước đây? Hãy nhìn vào xác suất ăn trộm trước đó, xem xét ví dụ, một sự kiện hay thuộc tính có tỉ lệ xuất hiện cơ bản là bao nhiêu hay cụ thể đến mức nào, có tính đại diện đến mức nào.
Charles Munger nói với chúng ta cách John nên suy nghĩ:
Nếu bạn dự định bắt 10 vụ tham ô một năm, bao nhiêu cơ hội để bất kỳ vụ nào trong số đó – áp dụng những gì mà Tversky và Kahneman gọi là thông tin về tỷ lệ xuất hiện cơ bản – có người chỉ đã làm điều đó một lần? Và những người đã từng làm điều này trước đó định tái phạm, họ muốn nói gì? Trong lịch sử của công ty, họ luôn luôn nói, “Tôi chưa bao giờ làm điều đó trước đây, và tôi sẽ không bao giờ tái phạm nữa.” Và chúng ta giữ tiền của họ lại. Đó có thể không phải là độc ác, nhưng hành vi kinh khủng đó sẽ lan rộng.

Việc xác định nhân chứng nhìn thấy hay bằng chứng DNA có nghĩa là người này có tội? Một xét nghiệm y học dương tính có nghĩa là người này đã mắc bệnh?
Trong thế kỷ 18, nhà toán học kiêm bộ trưởng Anh Thomas Bayes đã tạo ra một phương pháp đánh giá bằng chứng. Nhà toán học Pháp Pierre Simon de Laplace tạo cho phương pháp này một vỏ bọc hiện đại. Định lý Bayes khiến ta có thể cập nhật xác suất trước đó của một kết quả trong ánh sáng của bằng chứng mới. Nó rất dễ dùng nếu chúng ta thay đổi định dạng xác suất sang định dạng tần suất.
Hãy sử dụng định lý Bayes trong phiên bản đã sửa chữa của bài toán thuê xe cổ điển, nguyên bản được các nhà tâm lý học Daniel Kahneman và Amos Tversky phát triển.

John làm chứng trong phiên tòa: “Tôi đã chứng kiến vụ tai nạn và chiếc xe tham gia có màu xanh lá.”
Cái nhìn của John được kiểm tra độ tin cậy và các bài kiểm tra thiết lập thấy anh ấy có thể xác định đúng màu sắc xanh lá 8 trong số 10 lần. John đã nói “xanh lá” trong 8 trên 10 trường hợp khi có gì đó màu xanh lá và nói “xanh lá” 2 trong 10 trường hợp khi có thứ màu xanh da trời. Có nghĩa là John xác định sai màu 2 trong số 10 lần.
John làm nhân chứng chứng kiến sự việc thì đáng tin bao nhiêu? Bằng chứng nhân chứng luôn chứa mức độ không chắc chắn. Cũng nên nhớ rằng độ tin cậy của bất kỳ quan sát nào không chỉ phụ thuộc vào độ tin cậy của người quan sát – thậm chí nếu John có con mắt tốt – mà còn bởi có bao nhiêu khả năng quan sát của anh ta là đúng với các xác suất trước đó.
Trước hết chúng ta hỏi: Xác suất trước đó của đầu ra là gì? Một sự kiện trước đó chắc chắn bao nhiêu khi dùng để xem xét bằng chứng mới? Mức độ chắc chắn là bao nhiêu để một chiếc xe màu xanh lá tham gia vào vụ tai nạn trước khi ta xem xét bằng chứng của John? Giả sử tần suất tương đối (tỷ lệ các xe với một màu sắc nhất định trong một quần thể cụ thể tại một điểm cụ thể trong chuỗi thời gian) của những chiếc xe màu xanh da trời và màu xanh lá cho chúng ta thông tin về xác suất tham gia tai nạn trước đó. Tỷ lệ những chiếc xe màu xanh da trời và màu xanh lá trong tất cả các loại xe tại thời điểm của tai nạn là bao nhiêu? Giả sử có tổng số 100 chiếc xe trong thành phố. 90 màu xanh da trời và 10 xanh lá. Có nghĩa là xác suất trước đó để chiếc xe tham gia vào tai nạn có màu xanh lá là 10% (10 xe xanh lá trong số 100 xe).
Xác suất (sau đó – sau khi xem xét bằng chứng tình huống) chiếc xe xanh lá mà John đã nói nó màu xanh lá là bao nhiêu?

Màu xanh lá đã cho
Màu xanh da trời đã cho
Tổng số
John nói “xanh lá”
8 xe (10 x 0.8)
18 xe (90 x 0.2)
26

Nếu 10 trong số 100 xe là xanh lá và John đúng 8 trong 10 lần, thì anh ấy đã xác định 8 chiếc có màu xanh lá. Nếu John nói chiếc xe màu xanh lá và nó không có màu xanh lá, thì anh ấy có lẽ đã xác định 18 trong số 90 chiếc xanh da trời thành xanh lá. Trong số 26 chiếc xe John đã xác định là xanh lá, chỉ có 8 chiếc có màu xanh lá. Có nghĩa là xác suất chiếc xe xanh lá mà John làm chứng trong “chiếc xe tham gia có màu xanh lá” là 31% (8/26). Vậy chiếc xe tham gia có nhiều khả năng là màu xanh da trời hơn.
Trước khi John làm chứng, xác suất trước đó để chiếc xe tham gia có màu xanh lá chỉ là 10%. Khi anh ấy làm chứng “xanh lá”, xác suất đã tăng lên 31%.

“Dựa trên các vụ tai nạn có xe tham gia trong 50 năm, với cùng tỷ lệ màu sắc đã cho, có 3 trên 4 lần chiếc xe tham gia có màu xanh lá.”
Độc lập với tần suất các chiếc xe màu xanh lá và xanh da trời, xác suất tương ứng trước đó là bằng chứng từ các vụ tai nạn trong quá khứ. Cái chúng ta  muốn là bằng chứng đúng để đại diện cho cái có thể xảy ra trước khi chúng ta xem xét bằng chứng mới.
Khi chúng ta có bằng chứng đại diện mới, chúng ta phải cập nhật lại xác suất đại diện trước đó. Hãy hỏi: Chuyện gì xảy ra với các trường hợp tương tự trong quá khứ? Có lý do nào để sửa lại xác suất này không? Hoàn cảnh hay môi trường đã thay đổi? Càng không chắc chắn bao quanh một trường hợp cụ thể, càng nhấn mạnh chúng ta phải tập trung vào xác suất trước đó.

Bằng chứng mạnh thế nào?
Một yếu tố khi đánh giá bằng chứng là tỷ lệ trùng hợp ngẫu nhiên. Nó trả lời cho câu hỏi: Xác suất là bao nhiêu cho một người khác chứ không phải người bị tình nghi này, ngẫu nhiên được chọn, phù hợp với hồ sơ này? Ví dụ, khi đánh giá bằng chứng DNA, sự phù hợp ngẫu nhiên xảy ra khi 2 người khác nhau có chung một hồ sơ DNA.

Sau 5 ngày tìm kiếm, cảnh sát đã tìm thấy người phụ nữ bị siết cổ đến chết. Anh của John, Bill, bị xét xử vì tội giết cô ấy.
Có sự phù hợp trong hồ sơ DNA. Bằng chứng pháp y chống lại Bill là mẫu máu và mô lấy từ hiện trường vụ phạm tội, nó phù hợp với Bill. Có thể Bill hay ai đó khác đã để lại bằng chứng.
Xác suất trùng hợp ngẫu nhiên là bao nhiêu? Có bao nhiêu khả năng có sự phù hợp xảy ra giữa hồ sơ DNA tìm thấy tại hiện trường của vụ giết người và một người được chọn ngẫu nhiên? Có bao nhiêu khả năng hồ sơ của Bill phù hợp với hồ sơ của kẻ đã để lại bằng chứng tại hiện trường? Hồ sơ đó có hiếm không? Hồ sơ càng hiếm, xác suất hồ sơ của Bill phù hợp do ngẫu nhiên càng thấp.
Nhân chứng là chuyên gia y học của bên truy tố ước lượng (ước lượng về tần suất hồ sơ trong quần thể so sánh phù hợp nhất) xác suất để có sự phù hợp như vậy nếu Bill vô tội và sự phù hợp là trùng hợp ngẫu nhiên, chỉ bằng 1 trên 20,000. Có nghĩa là cứ mỗi 20,000 cá nhân, chỉ có 1 người có cùng hồ sơ DNA như cái đã tìm thấy tại hiện trường vụ giết người. Công tố viên biện hộ: “Chỉ có một trong 20,000 cơ hội ai đó khác Bill ngẫu nhiên có cùng hồ sơ với cái đã tìm thấy trong hiện trường vụ giết người. Xác suất do đó chỉ là 1 trên 20,000 để ai đó khác ngoài Bill bỏ lại bằng chứng.” Con số này có ảnh hưởng quan trọng tới phương tiện truyền thông và bồi thẩm đoàn. Bill bị cho là có tội và bị đề nghị án chung thân.
Phán xét đã sai ở đâu? Công tố viên làm mập mờ 2 khả năng. Xác suất Bill vô tội nhưng cho ra có sự phù hợp không giống với xác suất mà có sự phù hợp nhưng Bill vô tội. Công tố viên nên nói: “Xác suất là 1 trên 20,000 để ai đó khác Bill có thể bỏ lại cùng mẫu máu và mô như đã tìm thấy trong hiện trường vụ phạm tội.”
Bồi thẩm đoàn cũng cần xem xét các xác suất trước đó của tội phạm (trước khi đánh giá về bằng chứng pháp y được xem xét. Xác suất mà Bill là kẻ giết người không thể chỉ được tính từ duy nhất bằng chứng pháp y. Bằng chứng khác cần được xem xét. Sự rõ ràng của bằng chứng pháp y luôn phụ thuộc vào các bằng chứng khác. Cảnh sát có dữ liệu khác nào? Ai đó khác biết về Bill? Anh ấy có bằng chứng ngoại phạm không? Anh ấy có ở gần hiện trường vụ phạm tội không? Mỗi mẩu bằng chứng phải được xem xét với nhau, chứ không tách biệt. Có lẽ cũng có lời giải thích không liên quan đến phạm tội về lý do tại sao Bill bỏ lại mẫu máu và mô.
Dựa trên bằng chứng trước khi xem xét bằng chứng pháp y, bồi thẩm đoàn ước tính có 10% khả năng Bill là nguồn gốc của bằng chứng pháp y (90% anh ta không phải và do đó vô tội). Xác suất của sự phù hợp khiến Bill là tội phạm là 1 (con số nhạy cảm là 100%, ví dụ không có các kết quả sai âm tính) vì nếu Bill là nguồn của bằng chứng pháp y và kiểm tra trong phòng thí nghiệm là chính xác, hồ sơ DNA của anh ta sẽ phù hợp. Kết hợp nó với xác suất phù hợp ngẫu nhiên của một cơ hội trong 20,000 (hồ sơ DNA của anh ấy cho thấy ở hiện trường phạm tội chỉ do ngẫu nhiên) cho ra xác suất sau đó để Bill là nguồn gốc của bằng chứng pháp y là 99.96% (0.1/0.100045).

Phạm tội
Vô tội
Tổng số
Phù hợp
0.1 (10% x 100%)
0.000045 (90% x 1/20,000)
0.100045

Một cách xác định xác suất trước đó là hãy hỏi: Kẻ giết người có thể đến từ cộng đồng nào? Chúng ta cần biết cộng đồng so sánh phù hợp để ước lượng con số này. Vụ giết người xảy ra trong một thành phố 500,000 người. Giả sử bất kỳ ai trong thành phố cũng có thể là tội phạm. Một trong số họ là kẻ giết người. Trong số 499,999 người vô tội, chúng ta có thể hi vọng khoảng 25 người có DNA trùng hợp ngẫu nhiên. Có nghĩa là 26 người (25+ kẻ giết người) có thể là tội phạm. Vì Bill là một trong 26 người này, xác suất để anh ta là tội phạm với bằng chứng pháp y đã đưa ra, là 3.8% (1/26).
Nhưng điều đó có thực sự đúng không? Chỉ đúng nếu tất cả mọi người có xác suất phạm tội là ngang nhau. Ví dụ, tất cả họ đều cùng đi vào hiện trường vụ phạm tội.
Lựa chọn cộng đồng so sánh phù hợp cũng gây ra vấn đề. Nhân chứng là chuyên gia ước lượng xác suất phù hợp ngẫu nhiên như thế nào? Tỷ lệ thực sự trong hồ sơ này là bao nhiêu? Xác suất phù hợp ngẫu nhiên có nghĩa là hồ sơ này chỉ xảy ra ở một người trong số 20,000 cá nhân? Không, tần suất được tính toán chỉ là một ước lượng có thể sai theo một hướng nào đó.
Bằng chứng DNA cũng dễ dàn dựng tại hiện trường vụ phạm tội hơn vân tay chẳng hạn (Bằng chứng DNA dễ sản xuất hay dễ bóp méo hơn). Trong cuốn Scientific Conversations (Đối thoại khoa học) của Claudia Dreifus, nhà toán học pháp y Charles Brenner nói về trường hợp O.J.Simpson và bằng chứng DNA: “Bên bị đã làm gì đó rất thông minh từ quan điểm DNA: Họ nói bằng chứng được ngụy tạo. Chiến lược cơ bản của họ là thậm chí nếu nó phù hợp, nó vẫn phải là sự ngụy tạo. Họ từ bỏ chiến lược không công nhận bằng chứng DNA. Rõ ràng có sự phù hợp trong máu. Họ không bao giờ từ chối nó.”
Trong phiên tòa O.J.Simpson, bên bị biện luận rằng ít hơn 1 trên 1,000 kẻ lạm dụng vợ giết chết vợ mình. Do đó bằng chứng lạm dụng là không hợp lý và không nên thừa nhận trong một phiên tòa xử tội giết người. Nhưng xác suất phù hợp không phải là xác suất một người lạm dụng vợ mình rồi sau đó giết cô ấy. Cộng đồng so sánh tương đương cần xem xét là các bà vợ bị chồng họ lạm dụng rồi sau đó bị ai đó giết. Do đó, câu hỏi tương đương sẽ là: Xác suất một người giết người vợ được cho là anh ta đã lạm dụng và cho là cô ấy bị ai đó giết là bao nhiêu? Và Nicole Brown Simpson bị giết, chứ không chỉ bị lạm dụng.
John Allen Paulos nói trong cuốn Innumeracy (Phi số học), cho trước các thực tế hợp lý về giết người và lạm dụng, nó cho thấy nếu một người lạm dụng vợ mình hay bạn gái mình và sau đó cô ấy bị giết, kẻ lạm dụng là kẻ giết người chiếm 80%. Nhưng nó không có nghĩa là xác suất một người chồng hay bạn trai phạm tội giết người là 80%. Nó chỉ là một phần bằng chứng giữa nhiều cái cần được xem xét.

Lỗi xảy ra trong kiểm tra?
Vâng, một kiểu lỗi gọi là sai dương tính và sai âm tính. Sai dương tính giống như một cảnh báo sai. Sai âm tính là mất tác dụng thực tế. Ví dụ, vài yếu tố có thể ảnh hưởng đến độ tin cậy của kết quả kiểm tra y tế và gây ra sai dương tính là: độ chính xác lâm sàng của phương pháp kiểm tra (so sánh với vài “chuẩn vàng”), sự chuẩn bị của bệnh nhân, điều kiện y tế, phép trị liệu và lỗi thí nghiệm. Người ta cũng có thể gây ra lỗi khi chọn lọc và xử lý các mẫu, trong việc dịch các kết quả kiểm tra hay trong báo cáo kết quả kiểm tra một cách đúng đắn.

John kiểm tra dương tính với một bệnh hiếm có tỷ lệ tử vong 80%. Anh ấy đã sợ hãi biết bao.
Cơ hội để ai đó (một người được chọn ngẫu nhiên và thuộc về cùng nhóm rủi ro với John) thực sự bị bệnh này với kết quả xét nghiệm dương tính cho trước là bao nhiêu?
Giá trị tiên đoán của kiểm tra phụ thuộc vào độ chính xác lâm sàng của kiểm tra và các xác suất trước đó hay tỷ lệ các cá nhân có bệnh này trong quần thể chúng ta kiểm tra tại một thời điểm cho trước (tỷ lệ hiện hành). Độ chính xác lâm sàng được tạo bởi độ nhạy cảm (tần suất kiểm tra dương tính mà kết quả lại là các mẫu âm tính) và đặc tính (tần suất kiểm tra âm tính nhưng cho kết quả là các mẫu dương tính).
Giả sử quần thể có 100,000 người.
Tần suất những người mắc bệnh trong quần thể là 0.1%, ví dụ một trong 1,000 người bị bệnh đó. Trước kiểm tra, John có 0.1% cơ hội bị bệnh và 99.9% cơ hội không bị bệnh. Nếu kiểm tra 100% chính xác, 100 người nên kiểm tra dương tính và 99,900 người nên kiểm tra âm tính. Đó là những xác suất trước đó.
Kiểm tra có độ nhạy 97% hay đó là tỷ lệ dương tính đúng. Có nghĩa là 97 trong 100 người bị bệnh sẽ kiểm tra ra kết quả dương tính là đúng. Cũng có nghĩa là 3 trong số 100 người bị bệnh cho ra kết quả âm tính là sai (sai âm tính).
Kiểm tra có 95% đặc tính hay đó là tỷ lệ đúng âm tính. Có nghĩa là 95 trong số 100 người không bị bệnh sẽ cho ra kết quả âm tính đúng. 5% là không đúng. 5% số người không bệnh hay 4,995 người kiểm tra cho ra dương tính sai (sai dương tính).
Vì John được thông báo kết quả là dương tính, thông tin anh ta cần là tần suất những người kiểm tra dương tính và mắc bệnh (đúng dương tính) và tần suất những người kiểm tra dương tính nhưng không mắc bệnh (sai dương tính).

Bị bệnh
Không bị bệnh
Tổng số
Kiểm tra dương tính
97 (100 x 0.97)
4,995 (99,990 x 0.05)
5,092

Trong số mỗi 1,000 người thuộc về một nhóm có cùng rủi ro như John, chúng ta có thể hy vọng rằng có 19 người bị căn bệnh chết người này với kết quả kiểm tra dương tính (97/5,092). Xác suất để John bị mắc căn bệnh chết người này khi kết quả kiểm tra của anh ấy là dương tính là khoảng 1.9% hay rất thấp. Trong số 5,092 cuộc kiểm tra, hầu hết là sai dương tính, cho thấy họ bị bệnh khi thực tế không có bệnh đó.
Chuyện gì nếu một người kiểm tra ngẫu nhiên cho ra kết quả âm tính? Có 3 sai âm tính và 94,905 đúng âm tính, có nghĩa là nhiều hơn 99.9% cơ hội người đó không bị căn bệnh này.
Nhãn “đã kiểm tra dương tính” có thể đáng sợ nhưng nên nhớ rằng kiểm tra không phải là bệnh. Kiểm tra có thể rơi vào một nhóm sai dương tính. Nhưng tình huống xấu nhất là gì? Là thuộc về nhóm sai dương tính – bị chuẩn đoán là mắc bệnh nhưng thực tế không mắc, hay sai âm tính – bị chuẩn đoán là không mắc bệnh nhưng lại mắc?
Xác suất trước đó càng cao, hay căn bệnh càng phổ biến, kết quả đầu ra của kiểm tra càng đáng tin cậy. Ngược lại, xác suất trước đó càng thấp hay căn bệnh càng hiếm, kết quả kiểm tra càng không đáng tin cậy. Thậm chí một kiểm tra có độ chính xác cao cũng cho ra một kết quả không đáng tin cậy nếu nó kiểm tra một căn bệnh không phổ biến. Điều này cho thấy cá nhân bị kiểm tra không thuộc về nhóm người có nguy cơ cao bị bệnh đó.
Hãy hỏi: Tần suất người mắc bệnh là bao nhiêu trong quần thể so sánh tương đương trước khi tôi xem xét bằng chứng tình huống cụ thể? Kiểm tra y tế có độ chính xác bao nhiêu?
Lý luận trên có thể dùng để hỗ trợ đánh giá độ tin cậy của các bài kiểm tra chuẩn đoán hay các thủ tục sàng lọc. Vài ví dụ được sàng lọc hay chuẩn đoán của bệnh ung thư vú, ung thư tuyến tiền liệt, ung thư đại trực tràng, HIV hay dùng ma túy.
Ước lượng tần suất sai dương tính và sai âm tính cũng quan trọng khi đánh giá độ tin cậy của các bài kiểm tra nói dối (sử dụng trong thẩm vấn tội phạm hay khi sàng lọc nhân viên) và hệ thống định danh.
Trong các bài kiểm tra nói dối, sai dương tính xảy ra khi những người vô tội bị cho là dối trá. Sai âm tính xảy ra khi kẻ có tội bị xác định là không dối trá.
Trong các hệ thống định danh, sai dương tính khi hệ thống chấp nhận phù hợp trong khi không có sự phù hợp nào. Sai âm tính khi hệ thống thất bại trong nhận diện sự phù hợp dù thực tế có 1 sự phù hợp.
Xác suất sai dương tính cũng là một yếu tố để xem xét khi đánh giá giá trị các bằng chứng DNA. Có nghĩa là bồi thẩm đoàn trong trường hợp của Bill cũng cần quan tâm tới tỷ lệ sai dương tính. Bồi thẩm đoàn cần hỏi: Xác suất bao nhiêu để phòng thí nghiệm báo cáo có sự phù hợp giữa 2 mẫu không phù hợp? Một sự phù hợp được báo cáo không nhất thiết là một sự phù hợp thực sự trong thực tế. Lỗi có thể xảy ra. Giải thích có thể với sự phù hợp pháp y có lẽ bị sai do ô nhiễm (ngẫu nhiên hoặc cố ý), xử lý sai bằng chứng, hay đổi mẫu. Ví dụ, trong một vụ hiếp dâm, các nhà kỹ thuật của phòng thí nghiệm tội phạm cảnh sát Houston nói với bồi thẩm đoàn rằng họ tìm thấy sự phù hợp về DNA giữa DNA của kẻ hiếp dâm với người đàn ông bị tình nghi. Người đó bị kết án năm 1999 và bị đưa tới nhà tù thụ án 25 năm. Năm 2003, Sở cảnh sát Houston nói rằng DNA đó không phải từ người đàn ông bị kết án.
Khi đánh giá bằng chứng tình huống, chúng ta phải xem xét xác suất trước đó, xác suất của sự phù hợp ngẫu nhiên, và xác suất sai dương tính.

Không có nhận xét nào:

Đăng nhận xét

Chuẩn bị cho một khóa thiền Vipassana 10 ngày như thế nào?

Vì liên tục có nhiều bạn hỏi về các khóa thiền Vipassana mà mình thi thoảng tham gia, để không phải giải thích lại nhiều lần, mình viết các ...