本文是一篇電子商務(wù)論文,本文設(shè)計(jì)了基于LSTM的孿生屬性注意力網(wǎng)絡(luò)(SiameseATT)用于候選屬性選擇,SiameseATT網(wǎng)絡(luò)大大提高了商品智能問答中屬性選擇的性能。其次,我們通過知識(shí)圖譜的本體規(guī)則推理,將多跳屬性轉(zhuǎn)換為1跳屬性,解決了復(fù)雜的多跳屬性問答的問題。
1.緒論
1.1 電子商務(wù)及其客戶服務(wù)
隨著互聯(lián)網(wǎng)的迅速普及和信息技術(shù)的不斷創(chuàng)新,整個(gè)人類社會(huì)進(jìn)入了互聯(lián)網(wǎng)經(jīng)濟(jì)時(shí)代。與此同時(shí),在消費(fèi)領(lǐng)域,基于互聯(lián)網(wǎng)技術(shù)的電子商務(wù)(Electronic Commerce)已逐漸改變了人們的生活習(xí)慣和購物方式,越來越多的人開始使用網(wǎng)上購物。電子商務(wù)發(fā)展至今不過20年,卻給我們的生活帶來了翻天覆地的變化。

電子商務(wù)是指以電子化的方式實(shí)現(xiàn)整個(gè)商貿(mào)過程的各階段的活動(dòng),包括供應(yīng)鏈管理、電子支付、電子交易市場(chǎng)、在線營銷、在線交易處理和電子數(shù)據(jù)交換等[1]。近年來,許多電子商務(wù)企業(yè),例如淘寶(www.taobao.com)、京東(www.jd.com)、拼多多(www.pinduoduo.com)和亞馬遜(www.amazon.com)等飛速發(fā)展,逐漸占領(lǐng)消費(fèi)市場(chǎng)并獲得了巨大的成功。電子商務(wù)因其低成本、高效率和便利性,成為經(jīng)濟(jì)增長的新動(dòng)力[1]。特別是最近十年,我國電子商務(wù)行業(yè)持續(xù)保持兩位數(shù)的高速增長。據(jù)網(wǎng)經(jīng)社“電數(shù)寶”電商大數(shù)據(jù)庫(DATA.100EC.CN)顯示1 (如圖1-1所示),2019年國內(nèi)網(wǎng)絡(luò)零售市場(chǎng)交易規(guī)模達(dá)10.32萬億元,較2018年的8.56萬億元,同比增長20.56%。與此同時(shí),2019年國內(nèi)網(wǎng)絡(luò)零售用戶規(guī)模達(dá)7.32億人,較2018年的5.7億人,同比增長28.42%。
1.2 面向電子商務(wù)的智能客戶服務(wù)
近年來,面對(duì)日益增加的網(wǎng)購用戶和在線商品,諸如淘寶、京東、拼多多和亞馬遜等國內(nèi)外大型電子商務(wù)企業(yè)啟用了大量人力、物力、財(cái)力和信息系統(tǒng)來支撐客戶服務(wù)。然而,電子商務(wù)客戶服務(wù)的一些問題依然不可避免地出現(xiàn),例如服務(wù)支撐可用性有限、效率低下和成本高昂等[2]。具體而言,主要面對(duì)如下幾個(gè)突出問題:
1、如何及時(shí)、準(zhǔn)確和低成本地回答用戶問題?
在線購物時(shí),用戶為快速了解商品的詳細(xì)信息,常常會(huì)提出一些關(guān)于商品的問題,如“這款小米手機(jī)內(nèi)存多大?這款打底衫是什么材質(zhì)的?”等。許多商家都招聘了一定數(shù)量的客戶服務(wù)人員來在線解答這些問題。但實(shí)際上,用戶提出的問題大部分是重復(fù)的,許多高頻問題會(huì)經(jīng)常被詢問。因此,如果全由客服人員回答這些重復(fù)的問題是一項(xiàng)費(fèi)時(shí)耗力的工作。同時(shí),企業(yè)需要招聘大量的人員來回答這些問題,這種方式大大增加了企業(yè)服務(wù)成本。另一方面,由于有些咨詢問題較為專業(yè),許多客服人員也無法快速準(zhǔn)確地回復(fù),由此影響了商品的銷售和用戶的體驗(yàn)。再者,當(dāng)某些節(jié)假日臨近或商家促銷時(shí),購物的客流量會(huì)出現(xiàn)大幅激增,由于客服人員接待能力有限,此時(shí)便會(huì)出現(xiàn)許多用戶無人接管的情況,從而白白失去大量的銷售機(jī)會(huì)。同樣地,客戶服務(wù)人員也無法7×24小時(shí)不間斷工作,在夜間或其他休息時(shí)間的用戶咨詢問題也沒法及時(shí)回答,從而導(dǎo)致用戶流失。因此,如何及時(shí)、準(zhǔn)確和低成本地回答用戶的問題是電子商務(wù)客戶服務(wù)當(dāng)前所面臨的一個(gè)挑戰(zhàn)2。
2、如何向用戶推薦合適的商品?
電子商務(wù)網(wǎng)站存在成千上萬的商品,面對(duì)這些琳瑯滿目的商品,許多用戶會(huì)出現(xiàn)選擇困難,無從下手的情況。另外,由于商品眾多,一些新上市商品也不能第一時(shí)間被用戶發(fā)現(xiàn),從而失去了大量銷售的機(jī)會(huì)。因此,如何為用戶推薦合適的商品成為電子商務(wù)企業(yè)銷售中至關(guān)重要的一環(huán),同時(shí)也是客戶服務(wù)人員的重要工作之一。恰當(dāng)?shù)叵蛴脩敉扑]商品,既可以增加企業(yè)的銷售量,又可以提高用戶的滿意度。在傳統(tǒng)的線下購物中,許多商家都會(huì)雇傭?qū)I(yè)的導(dǎo)購人員來推銷商品。他們具有豐富的銷售經(jīng)驗(yàn),會(huì)根據(jù)用戶的要求和實(shí)際情況適時(shí)地向用戶進(jìn)行推銷。但在電子商務(wù)中,網(wǎng)絡(luò)購物的用戶與客戶服務(wù)人員無法進(jìn)行面對(duì)面溝通和交流,這導(dǎo)致客服人員對(duì)用戶的實(shí)際情況了解較少,很難做出合適地商品推薦。另一方面,在線商品眾多,客服人員很難準(zhǔn)確地進(jìn)行推薦。因此,如何向用戶推薦合適的商品成為電子商務(wù)客戶服務(wù)面對(duì)的一個(gè)關(guān)鍵問題。
2.基于知識(shí)圖譜和規(guī)則推理的商品智能問答模型
2.1 引言
近年來,隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)上購物已逐漸成為人們生活購物的一種主要方式。在線下購物時(shí),用戶通常向客服人員面對(duì)面地咨詢各類商品問題,通過客服人員的介紹,用戶可以先充分了解商品的信息再做出購買決策。同樣地,在線購物時(shí)用戶也常常會(huì)對(duì)商品提出一系列咨詢問題,例如“這款小米手機(jī)的內(nèi)存多大?”,“這款格力空調(diào)每小時(shí)耗電多少?”等。一般來說,電子商務(wù)企業(yè)都有在線客戶服務(wù)人員,用戶可通過發(fā)送圖片、文字或語音的方式與在線客服人員交流溝通商品問題。然而,這些咨詢問題很大部分是重復(fù)的,全由人工來回答這些重復(fù)的問題是一件非常耗時(shí)耗力的工作。另一方面,一些比較專業(yè)的問題要求在線客服人員具有較高的專業(yè)素養(yǎng),例如用戶咨詢商品的某些技術(shù)參數(shù)、適配環(huán)境等問題。顯然,大部分客服人員很難準(zhǔn)確無誤地記憶各種商品參數(shù),特別是在商品較多或更新較為頻繁時(shí)。在這樣的情況下,許多電子商務(wù)企業(yè)希望能夠通過商品智能問答系統(tǒng)來減少客服人員成本,同時(shí)提高問題回答的準(zhǔn)確率。因此,商品智能問答系統(tǒng)具有很高的應(yīng)用價(jià)值和研究價(jià)值。
在目前的應(yīng)用中,許多在線商品智能問答系統(tǒng)是通過意圖識(shí)別(用戶問題識(shí)別)和人工的答案配置來實(shí)現(xiàn)的。意圖識(shí)別本質(zhì)上是一個(gè)文本分類任務(wù),它需要訓(xùn)練一個(gè)文本分類器來識(shí)別“用戶問題”所表達(dá)的意圖,接著,通過人工對(duì)每個(gè)意圖配置固定的答案來實(shí)現(xiàn)商品的智能問答??偠灾?,基于意圖識(shí)別的商品智能問答使用較為靈活多樣、可定制性強(qiáng)且方法簡(jiǎn)單可靠。正因如此,如今許多小型電商企業(yè)常采用這種方法來實(shí)現(xiàn)商品智能問答。但該方法也存在一些不足,例如答案的配置過度依賴人工,對(duì)于同樣的意圖(問題)需要對(duì)每個(gè)商品單獨(dú)配置答案。因此,對(duì)商品比較多的大型電商企業(yè)而言,這種方法需要的配置工作量巨大,實(shí)用性較差。另外一些研究則嘗試通過評(píng)論中的內(nèi)容來解答用戶的問題。他們通過檢索式的方法找到評(píng)論中與問題最相關(guān)的部分,隨后將這部分內(nèi)容作為用戶問題的答案。與意圖識(shí)別的方法相比,這種方法不需要人工配置答案,但需要依賴一定數(shù)量的高質(zhì)量的商品評(píng)論。然而,在實(shí)際中許多商品不僅沒有大量的高質(zhì)量評(píng)論,甚至很多商品鮮有評(píng)論。因此,這類方法在應(yīng)用中也存在很大的局限性。近年來,隨著知識(shí)圖譜技術(shù)的發(fā)展,基于知識(shí)圖譜的商品智能問答逐漸成為研究的熱點(diǎn)。基于知識(shí)圖譜的方法不需要配置答案,也不需要依賴高質(zhì)量的評(píng)論,答案來自于知識(shí)圖譜。因此,這種方法相對(duì)于其他方法而言更為實(shí)用和高效,近年來被廣泛地使用在電子商務(wù)的商品智能問答中。
2.2 商品智能問答研究現(xiàn)狀
眾所周知,商品智能問答在大型電商企業(yè)中已得到廣泛的應(yīng)用,例如“阿里小蜜”、“百度小度”和“京東JIMI”等。這些商品智能問答系統(tǒng)能夠自動(dòng)回復(fù)用戶的問題,從而大大提高了商家的接待能力,降低了人力成本,并實(shí)現(xiàn)了7×24小時(shí)不間斷服務(wù)??傮w來講,商品智能問答不同于其他開放域的智能問答,它的回答內(nèi)容控制在商家所售商品領(lǐng)域,對(duì)于其他的閑聊問題并不作答,是一種限定域的問答系統(tǒng)。相較于其他智能問答,商品智能問答更要求答案的準(zhǔn)確率和專業(yè)性。目前對(duì)商品智能問答的研究主要分為以下3類:基于意圖識(shí)別和答案配置的智能問答、基于知識(shí)圖譜的智能問答和基于評(píng)論的智能問答。
2.2.1 基于意圖識(shí)別和答案配置的商品智能問答
如前文所述,一些中小型電子商務(wù)企業(yè)廣泛使用的在線商品智能問答主要是通過意圖識(shí)別和人工答案配置來實(shí)現(xiàn)的。意圖識(shí)別本質(zhì)上是一個(gè)文本分類任務(wù)(Question Classification),該算法能夠根據(jù)用戶提問的直接或者間接的信息來判斷用戶的真實(shí)意圖。在識(shí)別用戶意圖后,再將事先由人工配置的意圖所對(duì)應(yīng)的答案話術(shù)發(fā)送給咨詢用戶,即可實(shí)現(xiàn)智能問答。由此可見,該方法的重點(diǎn)和難點(diǎn)在于意圖識(shí)別。目前意圖識(shí)別的方法主要包括基于規(guī)則和人工特征工程的方法以及基于深度學(xué)習(xí)的方法。
3.基于知識(shí)圖譜的商品搭配推薦模型 ............................... 50
3.1 引言 ................................. 50
3.2 商品搭配推薦系統(tǒng)研究現(xiàn)狀 ................................ 53
4.基于外部記憶網(wǎng)絡(luò)的評(píng)論有用性預(yù)測(cè)模型 ......................... 79
4.1 引言 ........................... 79
4.2 評(píng)論有用性預(yù)測(cè)研究現(xiàn)狀 .................................. 83
5.基于聯(lián)合注意力機(jī)制的評(píng)論方面類別檢測(cè)模型 .................... 104
5.1 引言 ................................................... 104
5.2 評(píng)論方面類別檢測(cè)研究現(xiàn)狀 ............................... 106
5.基于聯(lián)合注意力機(jī)制的評(píng)論方面類別檢測(cè)模型
5.1 引言
近年來,情感分析和評(píng)論挖掘已成為學(xué)術(shù)界和工業(yè)界的熱門研究領(lǐng)域。如前文所述,在評(píng)論的意見挖掘中,我們面對(duì)的一個(gè)挑戰(zhàn)就是如何將標(biāo)簽(類別)準(zhǔn)確的分配給評(píng)論中的各個(gè)方面,這個(gè)工作稱為“方面類別檢測(cè)”(Aspect Category Detection ,ACD)。例如,一句這樣的評(píng)論“這個(gè)餐廳的服務(wù)真的很好!” ,我們可以為其指定一個(gè)方面類別“服務(wù)”。而另一句評(píng)論“餐廳的服務(wù)員非常好,但菜也真的不錯(cuò)!”,這條評(píng)論我們可以為其分配兩個(gè)類別,即“服務(wù)和食品”??梢钥匆?,方面類別檢測(cè)任務(wù)可以從評(píng)論中抽取更細(xì)膩度的意見,從而幫助公司改進(jìn)其產(chǎn)品或幫助用戶快速檢索感興趣的評(píng)論內(nèi)容。
目前的研究把評(píng)論方面類別檢測(cè)任務(wù)的方法分為了三類:無監(jiān)督的方法、有監(jiān)督的方法和半監(jiān)督的方法。無監(jiān)督的方法主要是利用詞典、規(guī)則或聚類的方法來完成。其中基于詞典的方法[165]主要結(jié)合意見詞典(如“精彩”、“昂貴”)和某些語法規(guī)則來執(zhí)行任務(wù)?;谠~典的方法簡(jiǎn)單有效且不需要標(biāo)記數(shù)據(jù)集,但需要預(yù)先設(shè)計(jì)規(guī)則和建立詞典,因此該方法不能很好地處理那些包含隱含語義的或較為復(fù)雜的句子。近年來,在評(píng)論方面類別檢測(cè)的研究中基于機(jī)器學(xué)習(xí)的方法逐漸興起,例如SVM[166]、神經(jīng)網(wǎng)絡(luò)模型[167]等方法在評(píng)論方面識(shí)別任務(wù)中均取得了不錯(cuò)的效果。機(jī)器學(xué)習(xí)的方法是有監(jiān)督的方法,雖然有監(jiān)督的方法能獲得較好的效果,但該方法需要大量的人工標(biāo)記的數(shù)據(jù),因此一些半監(jiān)督學(xué)習(xí)方法被應(yīng)用于評(píng)論方面類別檢測(cè)中。

6.全文總結(jié)與展望
6.1 全文工作總結(jié)
近年來,隨著互聯(lián)網(wǎng)技術(shù)的出現(xiàn)和發(fā)展,電子商務(wù)已成為人們購物和生活不可或缺的一部分。電子商務(wù)企業(yè)秉承以客戶和產(chǎn)品為中心的理念,因此在電子商務(wù)中客戶服務(wù)是其至關(guān)重要的一個(gè)環(huán)節(jié)。近年來,許多電子商務(wù)企業(yè)將人工智能和大數(shù)據(jù)等智能技術(shù)與電子商務(wù)客戶服務(wù)緊密地結(jié)合,使得電子商務(wù)客戶服務(wù)更為智能化和自動(dòng)化,由此邁入了智能客戶服務(wù)的時(shí)代。然而,面對(duì)日益激增的用戶群體和海量的商品,智能客戶服務(wù)也直面許多挑戰(zhàn)。本文在這樣的時(shí)代背景下,從電子商務(wù)客戶服務(wù)所面對(duì)業(yè)務(wù)問題入手,調(diào)研當(dāng)前已存在的解決方案(智能技術(shù)),重點(diǎn)對(duì)其中的關(guān)鍵技術(shù)進(jìn)行分析和研究,主要包括:商品智能問答、商品搭配推薦、評(píng)論有用性預(yù)測(cè)和評(píng)論方面類別檢測(cè)等4個(gè)關(guān)鍵技術(shù)。進(jìn)一步,在相關(guān)理論和數(shù)據(jù)的支撐下,對(duì)這些關(guān)鍵技術(shù)進(jìn)行改進(jìn)和優(yōu)化,最后在真實(shí)的電子商務(wù)數(shù)據(jù)集中對(duì)研究的方法進(jìn)行驗(yàn)證。本文的研究工作主要包括:
1、針對(duì)目前知識(shí)圖譜的商品智能問答存在的問題,本文提出一種基于知識(shí)圖譜和本體規(guī)則推理的商品智能問答模型。
首先,本文設(shè)計(jì)了基于LSTM的孿生屬性注意力網(wǎng)絡(luò)(SiameseATT)用于候選屬性選擇,SiameseATT網(wǎng)絡(luò)大大提高了商品智能問答中屬性選擇的性能。其次,我們通過知識(shí)圖譜的本體規(guī)則推理,將多跳屬性轉(zhuǎn)換為1跳屬性,解決了復(fù)雜的多跳屬性問答的問題。最后,在NLPCC-ICCPOL 2016問答數(shù)據(jù)集的實(shí)驗(yàn)證明了基于這種孿生屬性注意力網(wǎng)絡(luò)在屬性選擇上比大部分基線模型展現(xiàn)出更好的性能,并且該方法也更適合電商應(yīng)用場(chǎng)景。隨后,本文又利用淘寶網(wǎng)中的家電類商品數(shù)據(jù)構(gòu)建了一個(gè)商品智能問答的原型系統(tǒng)。該原型系統(tǒng)展現(xiàn)了通過知識(shí)圖譜規(guī)則推理實(shí)現(xiàn)動(dòng)態(tài)生成實(shí)體屬性,從而解決了多跳屬性問答的問題。最終,實(shí)驗(yàn)也證明了規(guī)則推理的方法能大大提升問答系統(tǒng)的性能。
2、針對(duì)商品搭配推薦中存在的問題,本文提出一種基于知識(shí)圖譜的搭配推薦模型,充分利用了電子商務(wù)中商品的標(biāo)題以及網(wǎng)站中其他可訪問的輔助信息用于提升搭配推薦的性能。
首先,本文根據(jù)商品的購買數(shù)據(jù)和類別信息構(gòu)建了一個(gè)名為ItemKG的知識(shí)圖譜,接著設(shè)計(jì)了TransH的變體來學(xué)習(xí)ItemKG中每個(gè)商品和類別的知識(shí)圖譜嵌入。另外,根據(jù)在線商品的中文標(biāo)題的特點(diǎn),本文開發(fā)了一種標(biāo)題編碼模型(TEM)來處理中文標(biāo)題并提取特征向量,隨后構(gòu)建了一個(gè)基于深度神經(jīng)網(wǎng)絡(luò)的搭配模型(FIRM),該模型結(jié)合了從ItemKG中學(xué)習(xí)到的商品和類別的知識(shí)圖譜嵌入以及通過標(biāo)題編碼模型而獲得標(biāo)題向量,用于計(jì)算查詢商品和候選商品之間的商品搭配概率。隨后,在真實(shí)的電商搭配數(shù)據(jù)集TIANCHI和POG中的實(shí)驗(yàn)表明,該模型性能較基線模型有大幅提升,同時(shí)通過消融實(shí)驗(yàn)證明知識(shí)圖譜對(duì)模型的積極影響。
參考文獻(xiàn)(略)
相關(guān)文章
UKthesis provides an online writing service for all types of academic writing. Check out some of them and don't hesitate to place your order.