Vén màn bí mật Công nghệ phân tích sentiment của các Social Listening tool
Bài viết này là một trong serie các bài viết cho thấy bức tranh thực sự về cách hoạt động của Buzzmetrics, một giải pháp lắng nghe và phân tích mạng xã hội đang được dùng để theo dõi các chiến dịch và thương hiệu quản lý bởi các tập đoàn lớn.
Bài viết này là một trong serie các bài viết cho thấy bức tranh thực sự về cách hoạt động của Buzzmetrics, một giải pháp lắng nghe và phân tích mạng xã hội đang được dùng để theo dõi các chiến dịch và thương hiệu quản lý bởi các tập đoàn lớn Coca-Cola, Unilever, Mead Johnson và các Agencies global như Ogilvy, Maxus, Leo Burnett, Phibious, Performics… tại Việt Nam.
TẠI SAO ĐO LƯỜNG SENTIMENT (CẢM XÚC NGƯỜI TIÊU DÙNG) LẠI QUAN TRỌNG TRONG VIỆC QUẢN LÝ CHIẾN DỊCH VÀ THƯƠNG HIỆU?
Khả năng phân tích sentiment là một công nghệ quan trọng phải có của các social media tool. Việc phân tích sentiment, nói một cách dễ hiểu, là lắng nghe và thấu hiểu những gì đang được nói về thương hiệu và chiến dịch trên các phương tiện truyền thông xã hội, nói như thế nào, tốt hay xấu, và tốt về mặt nào, xấu về mặt nào. Như vậy, để đo lường sentiment, thảo luận sẽ được chia thành thảo luận Tích cực, Tiêu cực, Trung lập và Hỗn hợp. Sự tương quan giữa số lượng của từng loại thảo luận này sẽ nói lên thái độ chung của người dùng trên các kênh social media đối với thương hiệu hoặc chiến dịch.
- Giúp Brand nắm được tình hình thị trường: Thông qua sentiment, các brand manager có thể nhanh chóng có được cái nhìn tổng quan về thái độ của khách hàng đối với thương hiệu của mình tại một thời điểm nhất định hoặc trong một khoảng thời gian nhất định. Hơn thế nữa, việc phân tích sentiment còn chỉ ra những điểm mạnh, điểm yếu của thương hiệu hoặc sản phẩm trong mắt người dùng, những mặt nào đang được đánh giá cao và những gì đang là tiêu điểm của thảo luận tiêu cực.
Ngoài ra, việc theo dõi sự thay đổi của sentiment trong một khoảng thời gian dài sẽ nói lên sức khỏe của thương hiệu (Brand health), giúp các brand manager và các marketer phần nào đánh giá lại hiệu quả hoạt động của các chiến dịch marketing và đưa ra định hướng cho các chiến dịch trong tương lai.
- Giúp Agency quản lý thương hiệu phản hồi: Nắm được những khía cạnh được đánh giá cao của thương hiệu/sản phẩm và có được thông tin nhanh chóng về các thảo luận tiêu cực (ở đâu, mang nội dung gì) cho phép agency có thể đến tận nơi thảo luận được viết để phản hồi kịp thời. Việc này không những giúp nâng cao hiệu quả hoạt động của agency mà còn giúp agency và brand chủ động hơn trong việc ngăn ngừa và xử lý khủng hoảng (crisis).
CÁC SOCIAL LISTENING TOOL ĐO LƯỜNG SENTIMENT NHƯ THẾ NÀO?
Hiện nay có 2 phương pháp chính được dùng để đo lường sentiment:
- Automated sentiment scoring (đo lường sentiment tự động)
- Manual sentiment scoring (đo lường sentiment bằng con người)
Mỗi phương pháp đều có những ưu, nhược điểm nhất định mà bài viết sẽ đi sâu vào phân tích dưới đây:
1. Automated sentiment scoring (phương pháp đo lường sentiment tự động)
Việc đo lường sentiment tự động được thực hiện dựa trên việc sử dụng công nghệ để nhận diện từ khóa và xét chúng trong những mối quan hệ ngữ nghĩa với các từ khác trong câu.
Ưu điểm:
Việc phân loại sentiment hoàn toàn tự động cho phép xử lý toàn bộ các thảo luận một cách nhanh chóng, đồng thời tiết kiệm thời gian và chi phí.
Nhược điểm:
Công nghệ nhận diện ngôn ngữ sẽ dẫn đến có những trường hợp phân loại không chính xác do 4 nguyên nhân chính:
- Ngữ cảnh: Một từ có thể mang ý nghĩa tích cực hoặc tiêu cực trong từng hoàn cảnh khác nhau.
- Sự nhập nhằng của sentiment: Một câu dù chứa từ khóa tích cực hoặc tiêu cực thì cũng chưa hẳn thể hiện sentiment. Ngược lại, một câu không chứa từ khóa tích cực hoặc tiêu cực nào lại có thể mang một sắc thái nhất định.
- Sự mỉa mai: Các công cụ đo lường sentiment tự động sẽ không thể phân biệt được đâu là từ mang ý nghĩa thông dụng và từ mang ý nghĩa mỉa mai.
- Từ lóng, từ địa phương, từ viết tắt, ngôn ngữ chat,…: Với sự phong phú của ngôn ngữ nói chung, và tiếng Việt nói riêng, thì các Social listening tool dù có hiện đại đến đâu cũng khó mà phân loại được sentiment theo phương pháp tự động mà vẫn mang lại kết quá chính xác.
2. Manual sentiment scoring (đo lường sentiment bằng con người):
Phân tích sentiment bằng con người nghĩa là việc phân loại sentiment được thực hiện hoàn toàn bằng con người. Phương pháp này cho kết quả chính xác 100% vì mỗi thảo luận sẽ được đọc và phân loại bằng con người và đảm bảo tính chính xác bởi quá trình kiểm định chất lượng (Quality control).
Ưu điểm
Do việc phân tích sentiment được thực hiện bằng con người nên độ chính xác cao, có thể phân loại được cả những thảo luận mang ý mỉa mai, từ lóng, nghĩa bóng,...
Nhược điểm:
Phương pháp này đòi hỏi nguồn nhân lực lớn và mất nhiều thời gian, nhất là trong những trường hợp chiến dịch marketing hoặc thương hiệu có nhiều thảo luận trên social media, do đó chi phí sẽ cao và đôi khi không đáp ứng được nhu cầu tìm hiểu tình hình tức thời (real time sentiment) hoặc daily report.
BUZZMETRICS PHÂN TÍCH SENTIMENT NHƯ THẾ NÀO?
Để đạt được hiệu quả cao nhất trong việc phân tích sentiment, Buzzmetrics sử dụng phương pháp kết hợp giữa Automated sentiment (Sentiment tự động) và Manual sentiment. Sentiment sẽ được phân loại tự động bằng máy dựa trên các Domain cụ thể và sau đó sẽ được kiểm tra lại một lần nữa bởi con người.
- Sentiment tự động dựa trên domain cụ thể:
Các công cụ Social Listening trên thế giới như iSentia, Brandtology, Sysomos, Radiant 6 hiện nay vấp phải vấn đề nhân diện ngôn ngữ tiếng Việt nên chưa thể phát triển ở Việt Nam và không phải công cụ nào ở Việt Nam cũng có khả năng phân tích sentiment tự động. Hiện tại thì công cụ Social Heat của Buzzmetrics là công cụ duy nhất tại Việt Nam có đội ngũ nghiên cứu và phát triển hoàn thiện các bộ từ điển (domain) và khả năng tư duy trí tuệ nhân tạo để thực hiện sentiment tự động dựa trên domain.
Nếu như sentiment tự động thường cho kết quả không chính xác vì nhiều lý do, thì việc phân tích sentiment tự động nhưng dựa trên những bộ từ điển của ngành hàng hoặc nhóm chủ đề cụ thể cho kết quả khả quan hơn nhiều. Hệ thống sentiment tự động mà Buzzmetrics sử dụng hiện được phát triển đến hơn 40 domain (bộ từ điển tương ứng với các ngành hàng) bao gồm cách phân loại sentiment và các Đặc tính (Attributes) cụ thể cho từng ngành hàng.
Các domain Buzzmetrics đã phát triển bao gồm hẩu hết các ngành hàng như Chăm sóc cá nhân (Da mặt, Toàn thân, Tóc,...), Ngân hàng, Sữa, Điện tử tiêu dùng (Smartphone, Tablet,...), Thức uống giải khát, Thức ăn nhanh, Giáo dục, Ô tô - Xe máy, Bất động sản,... cho phép sentiment được phân loại một cách chính xác hơn do dựa trên domain cụ thể và được cải thiện, phát triển liên tục bởi bộ phận R&D.
Tương ứng với mỗi Domain sẽ có những Attributes cụ thể tùy theo ngành hàng (tương đương với những đặc tính của ngành hàng). Bên cạnh những Attribute của Domain được định sẵn, hệ thống còn cho phép thêm các Custom Attributes tùy vào đối tượng sản phẩm, dịch vụ cần phân tích.
Ví dụ, ngành hàng Smartphone sẽ bao gồm các Attributes như Thiết kế (Design), Màn hình (Screen), Camera, Thời lượng pin (Battery), Khả năng chống nước (Water proofing), Giá (Price),..., tuy nhiên tùy vào sản phẩm smartphone cụ thể sẽ có thể tùy chọn thêm các Custom Attribute như Chất lượng âm thanh (Sound quality), Sự đổi mới (Innovation), Chất liệu (Material),...
Tự động gắn Attribute cùng với Sentiment cho mỗi Attribute
Mỗi bài viết hoặc thảo luận sẽ được hệ thống tự động gắn Attribute và Sentiment cho từng Attribute. Việc phân loại này dựa trên các từ khóa liên quan đến Attribute với độ chính xác khá cao cho phép phân loại cả những thảo luận chứa ý kiến Tích cực về khía cạnh này nhưng lại Tiêu cực hoặc Trung lập về khía cạnh khác.
Tùy thái độ của người dùng trong bài viết hoặc thảo luận nghiêng về phía Tích cực hay Tiêu cực nhiều hơn, hoặc không tỏ ra thái độ gì, mà sentiment của bài viết hoặc thảo luận đó sẽ được phân loại thành Tích cực, Tiêu cực hoặc Trung lập.
- Sentiment sau khi được phân loại tự động sẽ được kiểm tra lại bởi con người và máy học sẽ tích lũy thêm các phân loại này để cải thiện kết quả phân loại trong tương lai:
Việc kiểm tra lại bởi con người giúp giảm thiếu tối đa những sai sót của sentiment tự động, đồng thời do sentiment đã được phân loại bằng máy trước đó với độ chính xác ở mức tương đối do đó sẽ làm giảm đáng kể nỗ lực của con người, từ đó quá trình phân loại sentiment diễn ra nhanh chóng và hiệu quả hơn.
Đặc biệt là khả năng gắn Attribute tự động tương đối chính xác (do dựa trên keyword, ví dụ như "đẹp", "xấu" thì thuộc Attribute Thiết kế (Design) giúp rút ngắn quá trình kiểm tra lại rất nhiều, trong đó con người hầu như chỉ phải kiểm tra lại cách phân loại yếu tố cảm xúc (tích cực, tiêu cực, trung lập) chứ không cần phải sửa lại các Attribute.
Đồng thời khi sentiment của một thảo luận được sửa lại bởi con người thì hệ thống cũng tự động ghi lại trường hợp, học hỏi và cải tiến dần dần để ngày càng trở nên chính xác hơn. Đây là lý do tại sao kết quả phân loại cho các Domain như Hàng tiêu dùng và Điện tử của Buzzmetrics vốn đã phát triển lâu hơn sẽ có kết quả phân tích chính xác cao hơn các ngành hàng mới khác.
Thông tin bài viết