亞馬遜review中包含著客戶真實(shí)的情緒反饋,增長(zhǎng)后的數(shù)據(jù)分析也很重要。
挖掘評(píng)論并加以分析voc(客戶之聲)可以使企業(yè)更準(zhǔn)確、更有效地滿足客戶的期望,從而提高市場(chǎng)份額和客戶忠誠度。能夠讓企業(yè)在日益激烈的市場(chǎng)環(huán)境中,將有限的資源集中在更有可能被消費(fèi)者選擇和滿意產(chǎn)品上,而不是浪費(fèi)在可能失敗的產(chǎn)品上。這種方法也會(huì)幫助企業(yè)節(jié)省成本。且與消費(fèi)者創(chuàng)造了更好的情感鏈接。積極響應(yīng)客戶之聲也會(huì)提高客戶留存,增加客戶對(duì)品牌的忠誠度與參與度。對(duì)當(dāng)下如此高的獲客成本和客戶留存成本環(huán)境來說,這些好處不容小覷。
shulex voc 通過absa(細(xì)粒度情感分析)模型,進(jìn)行voc的深度分析。
一、什么是absa?
absa是基于方面的情緒分析(aspect-based sentiment analysis, absa),是一個(gè)重要的細(xì)粒度情感分析問題,旨在分析和理解人們?cè)诜矫鎸用娴挠^點(diǎn),在過去的十年中受到了廣泛的關(guān)注。在不同的場(chǎng)景中處理absa,引入了不同的任務(wù)來分析不同的情感元素及其關(guān)系,包括方面術(shù)語、方面類別、觀點(diǎn)術(shù)語和情感極性。
例如在淘寶中,這里對(duì)于評(píng)論信息的抽取就是典型的細(xì)粒度情感分析,買家對(duì)于手機(jī)幾個(gè)方面的評(píng)價(jià)有正有負(fù)。對(duì)細(xì)粒度的aspect進(jìn)行分析,一方面,有助買的人從自己看重的特征方面決定是否購買,另一方面,讓廠家能對(duì)自身的產(chǎn)品有更全面的認(rèn)知,從而進(jìn)行針對(duì)性的改進(jìn)??梢灶A(yù)想到這樣的信息抽取比單純的抽取喜歡/不喜歡更加具有應(yīng)用價(jià)值。
absa中,要體現(xiàn)出情感的是句子中的某個(gè)實(shí)體或者實(shí)體的某個(gè)方面,而不再是整個(gè)句子。例如手機(jī)是正品,但網(wǎng)絡(luò)不穩(wěn)定中的“正品,網(wǎng)絡(luò)”可以看做是方面。
二、普通情感分析與absa的區(qū)別
普通情感分析(general sentiment analysis)
主要包含兩部分:目標(biāo)(target)和情感(sentiment),目標(biāo)可以是任意一個(gè)實(shí)體或?qū)嶓w的任意一個(gè)方面,情感有積極/中立/消極(positive/neutral/negative)三種觀點(diǎn)(opinion),這里的情感只針對(duì)目標(biāo)。簡(jiǎn)單來說就是針對(duì)一個(gè)文本分析出其對(duì)應(yīng)的情感,是一個(gè)非常簡(jiǎn)單的文本分類任務(wù)。
absa(aspect-based sentiment analysis)
target可以是一個(gè)aspect category或一個(gè)aspect term,absa中的sentiment進(jìn)一步擴(kuò)展為opinion term和大體情緒取向(情感極性)。
二者區(qū)別圖示如下:
可以看到absa主要是擴(kuò)展了方面類別和方面觀點(diǎn)和觀點(diǎn)項(xiàng)。
舉個(gè)例子:
“我很想買這個(gè)產(chǎn)品,因?yàn)槲曳浅O矚g它的設(shè)計(jì),但它的價(jià)格不是很好。”
absa系統(tǒng)在這里的目標(biāo)是識(shí)別兩個(gè)方面:
設(shè)計(jì)和價(jià)格,以及它們相關(guān)的情緒。
換句話說,設(shè)計(jì):正面,價(jià)格:負(fù)面。
同一個(gè)文本中,不同的方面可以有不同的情感。在這個(gè)意義上,absa的輸出并不意味著是對(duì)文本中所表達(dá)的情感的一般指示,而是旨在提供一個(gè)更細(xì)化和詳細(xì)的信息。
通過一張圖快速學(xué)習(xí)一下absa中的4個(gè)關(guān)鍵情感元素:方面項(xiàng)(aspect term)、方面類別(aspect category)、觀點(diǎn)項(xiàng)(opinoin term)、情感極性(sentiment polarity):
三、absa的四個(gè)關(guān)鍵挑戰(zhàn)
從語言的角度來看,自動(dòng)識(shí)別方面和相關(guān)情感的任務(wù)是一件不太容易的事情,因?yàn)檎Z言是復(fù)雜的,很多時(shí)候不容易解釋和理解。識(shí)別正確的方面更是尤為困難,因?yàn)榭蛻艨梢詮亩嗑S度表達(dá)他們的意見(例如:對(duì)于產(chǎn)品的價(jià)格、質(zhì)量、性能、設(shè)計(jì)、用途等...)。另一方面,在消費(fèi)者反饋中識(shí)別情緒相對(duì)容易,因?yàn)榍榫w通常只分為三類——正面、負(fù)面或中立。但檢索與方面相關(guān)的正確情緒也可能很棘手。根據(jù)不同情況,在進(jìn)行基于方面的情感分析時(shí),我們會(huì)遇到以下挑戰(zhàn):
1.當(dāng)情緒來源于產(chǎn)品時(shí):
顧客會(huì)明確表達(dá)他們對(duì)產(chǎn)品或服務(wù)的贊賞與不滿。
例如:通過寫正面的形容詞(好、不錯(cuò)、太棒了)或負(fù)面的形容詞(壞、糟糕、可怕)。
也會(huì)簡(jiǎn)單強(qiáng)調(diào)產(chǎn)品的一些特征或通過對(duì)產(chǎn)品功能的描述來表達(dá)情感。例如:
·電池持續(xù)時(shí)間長(zhǎng)。
·烤箱升溫很快。
·脫毛器能拉動(dòng)毛發(fā)。
這些例子可以被解釋為“積極的”產(chǎn)品特征(一個(gè)確實(shí)能用很長(zhǎng)時(shí)間的電池被認(rèn)為是“質(zhì)量好”的),但如果在文本中使用類似的表達(dá)方式而不明確提及產(chǎn)品,它們就會(huì)產(chǎn)生歧義。例如:
a1. 它持續(xù)的時(shí)間長(zhǎng)。
b1. 它升溫很快。
c1. 它能拉動(dòng)頭發(fā)。
上述例子并沒有清楚地表明所指的確切產(chǎn)品或服務(wù)是什么。如果文本a1指的是“排隊(duì)”,b1指的是“手機(jī)”,或者c1指的是“剃須刀”呢?那么情緒就會(huì)是“消極的”。因此,“加熱很快”這個(gè)表達(dá)方式既可以是積極的,也可以是消極的,這取決于它所提到的產(chǎn)品(烤箱或手機(jī))。這就是為什么我們對(duì)產(chǎn)品本身的了解對(duì)于正確識(shí)別情感是至關(guān)重要的。
在shulex voc,我們會(huì)根據(jù)產(chǎn)品的特點(diǎn)定制我們的標(biāo)簽樹,以便正確檢測(cè)出想要傳達(dá)的情感。
2.當(dāng)情緒取決于目標(biāo)時(shí):
在描述一個(gè)產(chǎn)品或服務(wù)時(shí),客戶也可以參考其他實(shí)體。比如說:
“這個(gè)產(chǎn)品的價(jià)格不錯(cuò),我哥哥買的那個(gè)設(shè)計(jì)也不錯(cuò)。”
在這個(gè)例子中,系統(tǒng)能夠檢索到文本中提到的所有方面及其相關(guān)的情感(如價(jià)格:正面,設(shè)計(jì):正面)這些是不夠的。
重要的是系統(tǒng)只能選擇:“價(jià)格:正面”這一對(duì),因?yàn)樗桥c被檢查的產(chǎn)品有關(guān)的。“設(shè)計(jì):正面”這一對(duì)不應(yīng)該被選擇,因?yàn)樗傅氖且粋€(gè)不同的實(shí)體。
從另一個(gè)角度來看,機(jī)器需要能夠?qū)?ldquo;目標(biāo)”(當(dāng)前分析的主要產(chǎn)品/服務(wù))與其他實(shí)體區(qū)分開來。為了應(yīng)對(duì)這種挑戰(zhàn),shulex voc的nlp引擎提供了可以在文本中提到但實(shí)際上與分析無關(guān)的實(shí)體的指示(在上述例子中,“我哥哥買的那個(gè)”)。
3.當(dāng)情緒取決于評(píng)級(jí)時(shí):
有時(shí),客戶寫反饋時(shí)沒有在文本中明確說明情緒。這種情況普遍會(huì)出現(xiàn)在問卷調(diào)查中,公司要求客戶填寫問卷:對(duì)產(chǎn)品/服務(wù)進(jìn)行評(píng)級(jí),同時(shí)寫下評(píng)論。
評(píng)級(jí)代表了對(duì)產(chǎn)品/服務(wù)的總體情緒,分?jǐn)?shù)通常從1到10不等。1是“最負(fù)面”的情緒,10是“最正面”的情緒。但客戶在寫反饋意見時(shí)其實(shí)很少會(huì)在文本中明確說明某種情緒。
例如:客戶在問卷中的回答是陳述其喜歡/不喜歡的方面,沒有任何文本元素可以幫助識(shí)別這串文本的情感。
問題1:您如何評(píng)價(jià)我們的服務(wù)?
評(píng)價(jià)答案:10分
問題2:哪項(xiàng)服務(wù)給你帶來的感受最好?
文字性回答:客戶關(guān)懷
顧客在回答問題時(shí),會(huì)提到服務(wù)的一個(gè)相關(guān)特征,但沒有在正文中表達(dá)意見的取向。因此,只考慮文本呈現(xiàn)出的答案,就不可能確定他們對(duì)這方面的真實(shí)情緒。
如果對(duì)評(píng)級(jí)進(jìn)行打標(biāo),就有可能檢索到更完整的信息。簡(jiǎn)短的回答“客戶關(guān)懷”與一個(gè)等于10的評(píng)級(jí)相關(guān)。我們可以把文本信息和評(píng)級(jí)結(jié)合起來,推斷出作者對(duì)客戶關(guān)懷的贊賞。如果評(píng)分是“3”,我們就會(huì)把這個(gè)反饋解釋為一個(gè)負(fù)面的。
在shulex voc中,我們可以通過將沒有情感的結(jié)構(gòu)化反饋文本與客戶提供的評(píng)級(jí)聯(lián)系起來來管理這種反饋。從而對(duì)情感評(píng)級(jí)進(jìn)行打標(biāo),并對(duì)反饋進(jìn)行完整的分析。
4.當(dāng)情感不像它看起來那樣時(shí):
到目前為止,我們已經(jīng)看到了一些反饋文本的常規(guī)案例,在這些文本中情感可以被被隱含地傳達(dá)(通過我們對(duì)產(chǎn)品的了解被檢索出來),明確地傳達(dá)(但有時(shí)并不是指我們的目標(biāo)),或者完全沒有傳達(dá)出(由于非文本信息而被傳達(dá)例如問卷)。
還有一種有趣的情況,在這種情況下情感是明確傳達(dá)的,但所傳達(dá)出的情感并不是字面意思。主要是用來諷刺。在這種情況下,真正的情感與在文本層面上傳達(dá)的情感是相反的。例如:
這把牙刷三天后壞了!真的太棒了!
如果您正在尋找皮膚刺激,那就太好了!
雖然“真的太棒了”和“太好了”這兩個(gè)表達(dá)方式本身顯然是積極的,但從上下文來看,顧客想表達(dá)的是相反的情緒,因此給出了消極的反饋。這種例子強(qiáng)烈依賴于上下文,還要結(jié)合語言的理解才能甄別出來。
在shulex voc,我們會(huì)不斷檢查那些評(píng)級(jí)與文本級(jí)別的識(shí)別情緒不匹配的樣本。手動(dòng)抽樣檢查低評(píng)級(jí)評(píng)論(即具有整體負(fù)面情緒的評(píng)論),對(duì)樣本進(jìn)行手動(dòng)微調(diào)步驟使我們能夠檢索到客戶反饋中所傳達(dá)的真實(shí)情感。并提高識(shí)別準(zhǔn)確率。