Khi dữ liệu hình thành từ đám đông
Thứ Tư,  4/7/2018, 17:32 

Khi dữ liệu hình thành từ đám đông

Lê Thư

(TBKTSG) - Rồi đến một ngày có lẽ không xa, bạn với một ý tưởng táo bạo ấp ủ nào đó sẽ không dám thực hiện, khi mà các dữ liệu được phân tích qua các thuật toán cho thấy ý tưởng đó không đi theo cách suy nghĩ của nhiều người, giống như có thời người ta không nghĩ là một con tàu bằng sắt thì có thể nổi trên mặt nước. Hay như bạn có một dự án kinh doanh đầy tham vọng nhưng rồi bạn không dám mạo hiểm triển khai, bởi kết quả phân tích dữ liệu từ máy tính cho thấy dự án đó đi lạc ra khỏi xu thế chung của thời đại…

Có thể những tưởng tượng trên được cho là quá xa vời, thế nhưng những gì mà ứng dụng dựa trên máy học (machine learning) và dữ liệu lớn (big data) đang thực hiện, cùng với tâm lý đám đông chi phối, khiến bạn không thể không nghĩ về một viễn cảnh như vậy.

Big data được hình dung như một kho dữ liệu khổng lồ, tập hợp mọi thứ thông tin trên đời, và qua xử lý dữ liệu bởi những thuật toán trên máy tính sẽ đưa ra những xu hướng mà đám đông đang chọn lựa. Rất có thể khi đó bạn không đủ tự tin để đi ngược chiều với đám đông, từ những kết quả phân tích mà máy tính đã đưa ra.

Trong một bài viết mới đây trên TBKTSG(*), tác giả Hồ Quốc Tuấn đã kể lại một nghiên cứu đang rất “nổi” là người ta dùng máy tính để trả lời câu hỏi: “Có phải nhạc pop đang ngày một buồn hơn?”. Các nhà nghiên cứu đã dùng máy tính phân tích hơn 500.000 bản nhạc từ năm 1985-2015 nhằm tìm ra các thuộc tính khiến các bản nhạc trở nên nổi tiếng. Nghiên cứu này được thực hiện theo cách lấy dữ liệu lớn (toàn bộ phần chữ và ngữ điệu của 500.000 bài hát), bỏ vô máy tính chạy qua một thuật toán nhất định với những quy tắc cho máy học các thông số về tâm trạng, âm sắc, giai điệu, thể loại nhạc, nam tính hay nữ tính... và máy cho ra các kết luận. Một trong những phát hiện chính của nghiên cứu nói trên là độ vui vẻ (happiness) của các bản nhạc giảm dần theo thời gian và độ buồn thảm (sadness) thì tăng dần. Tiếp tục câu chuyện được nêu trong bài viết nói trên, một câu hỏi bật ra là liệu nhạc sĩ có nên sáng tác nhạc pop vui tươi khi công chúng đang nghiêng về nhạc pop buồn thảm như kết quả xử lý dữ liệu thông tin chỉ ra? Có thể không có câu trả lời rõ ràng nhưng chắc sẽ có một chút dè dặt khi đưa ra bản nhạc ngược với nhu cầu thưởng thức của số đông công chúng. Một giả định khác, nếu như big data chỉ ra nhạc Việt ngày càng sến có nguyên nhân từ gu thưởng thức của số đông công chúng thì có khi bạn phải xem lại việc đầu tư một nhà hát nhạc giao hưởng, trừ phi bạn không cần đến đối tượng thưởng thức đại chúng. Rõ ràng, bạn đã bị chi phối bởi những kết quả mà cơ sở của nó được hình thành từ việc nghiên cứu tâm lý đám đông.

Thực ra big data, một thành tựu công nghệ to lớn trong thời đại số, đã được sử dụng rộng rãi để phân tích, từ đó đưa ra những quyết định cho nhiều vấn đề quan trọng trên mọi lĩnh vực: kinh tế, chính trị, xã hội, truyền thông, giáo dục, y tế… Nhưng có một khía cạnh rất đáng quan tâm ở kho dữ liệu khổng lồ này, đó là tất cả những thông tin gì thuộc về con người đã được tập hợp vào trong hệ thống đó, từ thói quen, tính cách, tình cảm, quan điểm chính trị, các mối quan hệ xã hội, đến các hành vi mua sắm, tiêu dùng… Trong một số nghiên cứu về xã hội, người ta sẽ chọn loại dữ liệu này, tìm ra những đặc điểm chung nhất trong một tập hợp cá nhân đông đảo, phản ánh một xu hướng mà số đông đang theo, làm cơ sở tham khảo cho việc ra quyết định.

Một quyết định cần có sự ủng hộ của đám đông, nhưng một quyết định ra đời dựa trên xu hướng đám đông có khi lại là một điều cần cân nhắc. Các nghiên cứu về tâm lý đám đông cho thấy rằng một hành động, một suy nghĩ có thể xuất phát từ một cá nhân hay một nhóm và sau đó lan tỏa theo hiệu ứng tâm lý bầy đàn. Một kết luận dựa trên nghiên cứu số đông vì vậy cũng khó thể khẳng định là chân lý.

Thêm một thực tế khác được ghi nhận, cái mới, cái khác biệt thường không xuất phát từ số đông. Nếu một nghiên cứu chỉ ra rằng phải làm như thế này mà không làm như thế kia mới phù hợp với xu hướng chung của đám đông thì có lẽ sẽ không còn đường cho những cái mới xuất hiện.

(*) http://www.thesaigontimes.vn/273583/sao-nhac-viet-ngay-cang-sen-hay-hoi-big-data.html

TIN BÀI LIÊN QUAN
Chia sẻ:
   
CÙNG CHUYÊN MỤC
Giấy phép Báo điện tử số: 2302/GP-BTTTT, cấp ngày 29/11/2012