湛江電銷不封號系統(tǒng)怎么辦理,了解湛江電銷不封號系統(tǒng),咨詢湛江電銷不封號系統(tǒng)
電銷防封系統(tǒng),專為電銷企業(yè)定制的封號解決方案
支持批量外呼,無高頻,雙備份線路
實體號碼呼出,引入電話保護機制
從源頭降低封號風(fēng)險!!!
基于中文環(huán)境的微博與基于英文環(huán)境的Twitter在語言表達習(xí)慣上存在著很大的差異,因此用于微博文本的情感分析工具與Twitter平臺上的情感分析相比有很大不同。劉智等人從集成學(xué)習(xí)的角度出發(fā),設(shè)計了一種基于樣本空間動態(tài)劃分的機制,在此機制上構(gòu)建了微博文本情感分類器,通過實驗實現(xiàn)了大規(guī)模評論集的情感分析以及用戶觀點挖掘[9]。史偉等人提出了一種基于KBANN的情感分析方法來解決沒有情感關(guān)鍵詞存在的文本,通過構(gòu)建隱性知識來推測文本的情感狀態(tài)[10]。眾多研究學(xué)者為微博話題發(fā)現(xiàn)和輿情文本情感分析注入了新的研究方法和思想理念。而基于多源數(shù)據(jù)挖掘與融合來研究輿情文本情感與輿情演化規(guī)律的研究很少。故本文從多源數(shù)據(jù)角度出發(fā),利用文本情感分析技術(shù),對不同數(shù)據(jù)源中的網(wǎng)絡(luò)輿情情感狀況進行分析,實現(xiàn)對網(wǎng)民情感的挖掘,為網(wǎng)絡(luò)輿情的引導(dǎo)和控制提供有益借鑒。
(一)數(shù)據(jù)源選取。在中文語言環(huán)境中,輿情案例的數(shù)據(jù)源一般都來自新浪微博。它是一個為大眾提供信息交流共享和娛樂休閑的平臺。據(jù)央視財經(jīng)統(tǒng)計,截止2020年第三季度,微博的月活躍用戶數(shù)達5.11億。因此,以新浪微博為數(shù)據(jù)源進行的研究具有一定的代表性。
(二)數(shù)據(jù)采集。在明確研究對象和數(shù)據(jù)來源后,要對輿情案例的相關(guān)數(shù)據(jù)進行采集。根據(jù)新浪微博平臺的數(shù)據(jù)開放程度和網(wǎng)頁結(jié)構(gòu)特點,采用Python軟件通過網(wǎng)絡(luò)爬蟲的方式獲取文本數(shù)據(jù),并且有針對性的編寫Python腳本抓取微博文本數(shù)據(jù)。利用新浪微博的高級搜索功能,選定時間范圍為2019年3月1日到2019年8月30日,以“經(jīng)貿(mào)磋商”為搜索關(guān)鍵詞,編寫Python爬蟲程序進行數(shù)據(jù)采集,采集的主要字段包括:用戶名、發(fā)布內(nèi)容、發(fā)布時間。共采集到17436條微博文本數(shù)據(jù)。
(三)數(shù)據(jù)預(yù)處理。由于微博平臺具有大眾化,不受任何的時空限制,靈活度較高的特點,用戶在發(fā)表博文的過程中,不會受到文字格式的約束,因此文本內(nèi)容中往往包含大量噪聲數(shù)據(jù),如網(wǎng)址HTML標(biāo)簽、話題標(biāo)簽、無用的表情符號等。這些噪聲數(shù)據(jù)對文本的分詞和詞頻統(tǒng)計都會造成影響,所以在數(shù)據(jù)預(yù)處理階段要對這些無意義的信息進行清洗。使用正則表達式對文本內(nèi)容數(shù)據(jù)進行清洗,刪除重復(fù)的文本數(shù)據(jù),刪除@、數(shù)字、無用網(wǎng)址、表情等無關(guān)內(nèi)容,提取文本內(nèi)容,再將清洗后的數(shù)據(jù)進行分詞處理,利用python中的JIEBA分詞工具包,對文本內(nèi)容逐條進行分詞,去除停用詞、標(biāo)點符號等無意義的詞。對處理好的數(shù)據(jù)進行高頻詞統(tǒng)計并繪制詞云圖,其結(jié)果如表1和圖1所示。數(shù)據(jù)來源:根據(jù)采集的微博文本數(shù)據(jù)統(tǒng)計整理而得。由高頻詞可以看出,網(wǎng)民支持國家做出的決定,紛紛為國家加油打氣,表示中國絕不會被此事件嚇倒,此事件的發(fā)生會讓國家變得越來越強大,不畏懼對方提出的挑戰(zhàn),表現(xiàn)出了網(wǎng)民的愛國主義情懷。
版權(quán)聲明:本文為原創(chuàng)文章,版權(quán)歸 admin 所有,歡迎分享本文,轉(zhuǎn)載請保留出處!