Sao nhạc Việt ngày càng sến, hãy hỏi big data
Thứ Hai,  11/6/2018, 08:22 

Sao nhạc Việt ngày càng sến, hãy hỏi big data

Hồ Quốc Tuấn

(TBKTSG) - Bạn có bao giờ nghĩ rằng người ta có thể dùng phân tích ngôn ngữ bằng máy tính và dữ liệu lớn để trả lời cho câu hỏi: “Có phải nhạc Việt ngày càng sến?”. Triển vọng đó đang ngày càng gần.

Các bài nhạc vui nhộn, phù hợp cho các buổi tiệc, và các bài hát “nữ tính” hơn thì sẽ có tỷ lệ thành công cao hơn. Ảnh: Internet

Trong tuần qua, người viết đọc được một nghiên cứu đang rất “nổi” là người ta dùng máy tính để trả lời câu hỏi: “Có phải nhạc pop đang ngày một buồn hơn?”. Các nhà nghiên cứu của các khoa Toán và khoa Thống kê thuộc Đại học California-Irvine đã dùng máy tính phân tích hơn 500.000 bản nhạc từ năm 1985-2015 nhằm tìm ra các thuộc tính khiến các bản nhạc trở nên nổi tiếng (tiêu chí nổi tiếng là việc được xếp đầu các bảng xếp hạng).

Một trong những phát hiện chính của nghiên cứu nói trên là độ vui vẻ (happiness) của các bản nhạc giảm dần theo thời gian và độ buồn thảm (sadness) thì tăng dần. Dường như trào lưu nghe nhạc buồn, nhạc sến ở Việt Nam có lẽ không phải là cái gì bất thường cả.

Tuy nhiên, điều đáng chú ý là các bài nhạc vui nhộn, phù hợp cho các buổi tiệc, và các bài hát “nữ tính” hơn thì sẽ có tỷ lệ thành công cao hơn. Điều này khiến tôi liên tưởng đến những bài nổi tiếng như Gangnam Style hay những bài hát của Taylor Swift.

Đây là một trong vô vàn ứng dụng mà máy học (machine learning) và dữ liệu lớn (big data) đang mở ra cho khoa học xã hội. Bài nghiên cứu trên là một ứng dụng đơn giản của nó: lấy dữ liệu lớn (toàn bộ phần chữ và ngữ điệu của 500.000 bài hát), bỏ vô máy tính chạy qua một thuật toán nhất định với những quy tắc cho máy học các thông số về tâm trạng, âm sắc, giai điệu, thể loại nhạc, nam tính hay nữ tính... và máy cho ra các kết luận. Điều này cũng có thể áp dụng để trả lời cho câu hỏi nghiên cứu dạng như “có phải nhạc Việt ngày càng sến?” hay “dòng nhạc nào sẽ thịnh hành trong những năm tới?” (mặc dù dự đoán là một ngành nghiên cứu có độ chính xác rất thấp).

Tất nhiên những nghiên cứu này còn rất nhiều giới hạn. Chẳng hạn định nghĩa thế nào là “sến”, xếp loại thế nào là “nam tính”, “nữ tính”, nhạc nào được xem là có tính vui tươi, phù hợp cho nhảy múa... như bài nghiên cứu kia đưa ra còn rất nhiều điều gây tranh cãi. Nói cho đơn giản, làm thế nào để xác nhận một bài nhạc là “buồn” một cách chính xác tương đối cũng đủ để các nhà nghiên cứu cãi nhau 20 năm nữa.

Khuôn mặt, giọng nói, chữ viết, ngôn ngữ, ký tự, thậm chí là dữ liệu di chuyển, mua sắm, lướt mạng xã hội... đang trở thành một kho tri thức mới mà người ta có thể khai thác.

Nhưng đây là một ví dụ có rất nhiều loại dữ liệu mới sẽ ra đời và được ứng dụng để trả lời nhiều loại câu hỏi. Chẳng hạn có một nghiên cứu trên một tạp chí hàng đầu ngành kế toán cho rằng các CEO có khuôn mặt nam tính hơn thì có khả năng “bùa phép” số liệu sổ sách nhiều hơn và lý giải rằng khuôn mặt phản ánh một số đặc tính của hormone phái mạnh và hormone này có ảnh hưởng đến các hành vi điều hành công ty. Những nghiên cứu này xem ra cũng có liên quan đến các khoa học huyền bí như xem tướng của người xưa và cũng có thể giúp mở ra những hướng nghiên cứu mới kết hợp kiến thức cổ đại và hiện đại.

Khuôn mặt, giọng nói, chữ viết, ngôn ngữ, ký tự, thậm chí là dữ liệu di chuyển, mua sắm, lướt mạng xã hội... đang trở thành một kho tri thức mới mà người ta có thể khai thác. Bạn sẽ nghĩ sao khi người ta khiến máy tính có thể làm “thầy bói” dự đoán tương lai người khác khi người ta có thể quét khuôn mặt của mấy tỉ người trên hành tinh và dựa vào những số liệu về thu nhập, hôn nhân, giáo dục... để kết luận một người có thể thành công hay không, sẽ ly dị vợ bao nhiêu lần hay sẽ có khả năng trở thành một người đoạt giải Nobel?

Những thứ đó chừng năm năm trước người viết nghĩ chỉ là những yếu tố lãng mạn. Nhưng chừng một năm trở lại đây, tôi đã tận mắt chứng kiến những ứng dụng không thể tin được của xu thế này, và bản thân tôi cuối cùng cũng bị đồng nghiệp “dụ dỗ” tham gia vào một vài dự án nghe có vẻ “tào lao” như kiểu nghiên cứu rằng những thông tin trên Linkedin của một nhà phân tích chứng khoán có thể giúp bạn dự đoán tỷ suất sinh lợi từ những đề nghị mua hay bán của anh ta. Cái hấp dẫn của dữ liệu lớn, máy học và tâm lý đám đông trong xu thế mới là không thể cưỡng lại.

Bong bóng công nghệ hình thành, có lẽ một phần cũng do cái sự hào hứng có phần phi lý trí này (irrational exuberance). Nhưng khi đã chứng kiến một vài ứng dụng đó, tôi phải thừa nhận là rất khó có thể cưỡng lại nó. Đôi khi dại khờ một vài lần chạy theo đám đông cuồng công nghệ cũng không có gì xấu. Bong bóng hay không, 10 năm nữa hạ hồi phân giải. Nhưng bây giờ, khi buổi sáng bạn bước vào một quán cà phê ở London và máy pha cà phê tự “bắt” ra một cái lá thiệt đẹp có khuôn mặt bạn ở trên đó (điều mà các bạn pha chế ở quầy sẽ không dễ gì làm được), bạn cũng sẽ thấy tò mò và thú vị về công nghệ đằng sau nó chứ?

TIN BÀI LIÊN QUAN
Chia sẻ:
   
CÙNG CHUYÊN MỤC
Giấy phép Báo điện tử số: 2302/GP-BTTTT, cấp ngày 29/11/2012