大數(shù)據(jù)監(jiān)測監(jiān)管是針對互聯(lián)網(wǎng)視聽節(jié)目、互聯(lián)網(wǎng)輿情、移動互聯(lián)網(wǎng)視聽內容、網(wǎng)絡出版物、手機APP內容等不同監(jiān)測領域于一體的一套可擴展的智能監(jiān)測解決方案,主要包括“全網(wǎng)無證網(wǎng)站視聽節(jié)目監(jiān)測系統(tǒng)”、“持證網(wǎng)站視聽節(jié)目監(jiān)測系統(tǒng)”、“'兩微一端'視聽節(jié)目監(jiān)測系統(tǒng)”、“網(wǎng)絡直播內容監(jiān)測系統(tǒng)”、“網(wǎng)絡文學監(jiān)測系統(tǒng)&rdquo、“游戲APP監(jiān)測系統(tǒng)&rdquo、“互聯(lián)網(wǎng)輿情監(jiān)測系統(tǒng)&rdquo、“手機APP內容監(jiān)管系統(tǒng)&rdquo、“IPTV節(jié)目內容監(jiān)管系統(tǒng)”等產品,分別針對不同監(jiān)測范圍和不同監(jiān)測內容,充分考慮技術上應有的主動性和先進性,在自動發(fā)現(xiàn)、下載、取證各類互聯(lián)網(wǎng)內容的基礎上,充分利用現(xiàn)代計算機文本內容分類、自然語言處理、音視頻內容分析等模式識別算法,對下載的互聯(lián)網(wǎng)內容進行智能化的自動審核判定,通過良好的人機交互界面實現(xiàn)主動、高效的互聯(lián)網(wǎng)內容綜合監(jiān)測。
(一)全網(wǎng)無證網(wǎng)站視聽節(jié)目監(jiān)測系統(tǒng):
針對全網(wǎng)無證網(wǎng)站,主要面向各互聯(lián)網(wǎng)信息發(fā)布平臺進行違規(guī)視聽節(jié)目的智能采集與內容分析研判,監(jiān)測目標范圍主要包括:各大主流搜索引擎、微博搜索、網(wǎng)盤搜索、磁力搜索、微信公眾號等。系統(tǒng)綜合利用視聽節(jié)目鏈接有效性進行研判、文本分級詞庫(敏感詞加密顯示)檢索、音視頻圖像內容分析技術等多種技術手段,較傳統(tǒng)關鍵詞的方式大幅提升違規(guī)研判的準確率。
傳統(tǒng)的監(jiān)測方式需要先搜集轄區(qū)內的無證視聽網(wǎng)站,然后選擇部分無證網(wǎng)站,由技術人員創(chuàng)建爬蟲模板后才能完成數(shù)據(jù)的采集與監(jiān)測;因此傳統(tǒng)的監(jiān)測方式不僅無法做到無證視聽網(wǎng)站的全面覆蓋,而且需要耗費大量的硬件資源以及網(wǎng)絡帶寬資源,同時搜索周期長,一般需要1至2天;互聯(lián)網(wǎng)80%以上的信息來源于主流的傳播平臺與發(fā)布渠道,因此系統(tǒng)能夠以小的代價在15分鐘內完成轄區(qū)內敏感視聽節(jié)目的全網(wǎng)搜集與準確過濾,此外多種技術手段進行違規(guī)復篩,能夠保障自動將準確的敏感視聽節(jié)目推送給用戶;
(二)持證網(wǎng)站視聽節(jié)目監(jiān)測系統(tǒng):
系統(tǒng)自動采集持證網(wǎng)站全站視聽節(jié)目,對持證網(wǎng)站視聽節(jié)目進行全方位的深入分析,主要包括:板塊分布情況;日新增節(jié)目的發(fā)布趨勢,節(jié)目發(fā)布時段分布;違規(guī)板塊分布、違規(guī)發(fā)布者分布、違規(guī)類型分布;違規(guī)節(jié)目發(fā)布趨勢、發(fā)布時段分布等。系統(tǒng)通過黑白名單及違規(guī)詞反衍自學習、文本內容初篩、音視頻圖像內容復篩等多種研判手段,顯著提升研判準確率。此外,系統(tǒng)獨創(chuàng)的四畫面監(jiān)聽監(jiān)看模式,大幅提升了人工復審的效率,并提供日常監(jiān)聽監(jiān)看工作量考核體系。
系統(tǒng)采用“后廠+前店”的工作模式,結合完備的敏感節(jié)目庫以及內容智能分析技術,應用分析完全貼合廣電總局的相關業(yè)務要求。
(三)“兩微一端”視聽節(jié)目監(jiān)測系統(tǒng):
系統(tǒng)通過網(wǎng)絡爬蟲自動搜集涉“我”的微博賬號、微信公眾號,涉“我”手機APP視聽應用,微博、微信公眾號中發(fā)布的視聽節(jié)目,手機APP應用中發(fā)布的視聽節(jié)目,通過違規(guī)專題配置與管理、違規(guī)視聽節(jié)目監(jiān)測、違規(guī)視聽節(jié)目綜合檢索等核心功能,生成統(tǒng)計分析與報表。公司具備豐富的“兩微一端”數(shù)據(jù)采集技術經(jīng)驗,能夠確保數(shù)據(jù)的查全率,除廣電領域外相關產品在安全領域也已實際落地應用。
(四)網(wǎng)絡直播內容監(jiān)測系統(tǒng):
系統(tǒng)利用互聯(lián)網(wǎng)爬蟲對直播平臺中的熱門播主、直播房間等信息進行主動搜集,對于觀眾較為密集或數(shù)量呈激增趨勢的播主或房間能夠主動提醒用戶實施關注,從而輔助用戶在一定程度上實現(xiàn)網(wǎng)絡直播服務平臺的日常監(jiān)管。系統(tǒng)核心功能包括:(1)熱門主播自動發(fā)現(xiàn)與管理;(2)疑似違規(guī)播主分析研判;(3)敏感直播房間追蹤分析。該系統(tǒng)兼容直播網(wǎng)站與直播APP應用中的直播內容監(jiān)測;能夠通過涉黃涉暴圖像檢測對直播視頻中的違規(guī)圖像自動追蹤,主動發(fā)現(xiàn)直播過程中的違規(guī)情況并報警;能夠對直播過程中的違規(guī)視頻進行自動取證。目前,該系統(tǒng)已在兩會期間發(fā)揮重要作用。
(五)網(wǎng)絡文學監(jiān)測系統(tǒng):
網(wǎng)絡文學監(jiān)測系統(tǒng)針對互聯(lián)網(wǎng)中傳播的文學出版物,重點針對網(wǎng)絡小說、漫畫、有聲小說等。系統(tǒng)首先采用先進的網(wǎng)絡爬蟲與下載技術,在自動發(fā)現(xiàn)、下載、取證各類出版物內容的基礎上,然后充分利用涉黃涉暴圖像識別、字符識別、語音識別、文本比對等技術,對下載的相關網(wǎng)絡文學出版物內容進行智能化判定,實現(xiàn)主動高效的網(wǎng)絡文學監(jiān)測。系統(tǒng)自動對網(wǎng)站內的網(wǎng)絡文學出版物中是否含有違規(guī)內容進行分析研判與自動下載取證。系統(tǒng)自動對含有違規(guī)內容的網(wǎng)絡文學出版物進行持續(xù)監(jiān)測,以檢查違規(guī)內容的刪除情況,如未刪除,則督促其盡快刪除。系統(tǒng)自動對網(wǎng)絡文學出版物的傳播熱度、傳播違規(guī)內容等情況進行統(tǒng)計分析。
系統(tǒng)采用語音識別技術將有聲小說識別翻譯為文本形式,能夠自動發(fā)現(xiàn)有聲小說中的敏感內容;
系統(tǒng)采用字符識別技術對圖片中的文字進行識別,能夠自動發(fā)現(xiàn)圖片文字中的敏感內容;
系統(tǒng)采用涉黃涉暴圖像識別技術主動發(fā)現(xiàn)網(wǎng)絡出版物中的涉黃涉暴內容;
系統(tǒng)的涉黃圖像識別支持“成人漫畫”的自動識別,且識別準確率高。
(六)游戲APP監(jiān)測系統(tǒng):
網(wǎng)絡文學監(jiān)測系統(tǒng)針對互聯(lián)網(wǎng)中傳播的文學出版物,重點針對網(wǎng)絡小說、漫畫、有聲小說等。系統(tǒng)首先采用先進的網(wǎng)絡爬蟲與下載技術,在自動發(fā)現(xiàn)、下載、取證各類出版物內容的基礎上,然后充分利用涉黃涉暴圖像識別、字符識別、語音識別、文本比對等技術,對下載的相關網(wǎng)絡文學出版物內容進行智能化判定,實現(xiàn)主動高效的網(wǎng)絡文學監(jiān)測。系統(tǒng)自動對網(wǎng)站內的網(wǎng)絡文學出版物中是否含有違規(guī)內容進行分析研判與自動下載取證。系統(tǒng)自動對含有違規(guī)內容的網(wǎng)絡文學出版物進行持續(xù)監(jiān)測,以檢查違規(guī)內容的刪除情況,如未刪除,則督促其盡快刪除。系統(tǒng)自動對網(wǎng)絡文學出版物的傳播熱度、傳播違規(guī)內容等情況進行統(tǒng)計分析。
主動搜集轄區(qū)內相關的游戲APP信息,并通過文本分析、視頻圖像分析等技術對于游戲的簡介、宣傳海報等內容進行分析,能夠主動發(fā)現(xiàn)疑似含有違規(guī)內容的游戲APP,從而提醒用戶進行關注,在一定程度上實現(xiàn)游戲APP違規(guī)內容的日常監(jiān)管。主要包括兩個核心功能:
(1)游戲APP自動發(fā)現(xiàn)與管理
針對游戲APP門戶網(wǎng)站,系統(tǒng)主動搜集省轄區(qū)本地或用戶指定條件的相關游戲APP信息,用戶可通過游戲APP自動發(fā)現(xiàn)與管理模塊對系統(tǒng)自動發(fā)現(xiàn)的游戲APP軟件信息進行管理操作。可查詢系統(tǒng)搜集到的游戲APP軟件的相關信息。
(2)疑似違規(guī)游戲APP自動研判與審核
結合“違規(guī)知識庫”以及淫穢色情圖像識別技術,能夠對游戲APP中的文本以及相關圖片進行自動鑒別,將其自動研判為違規(guī)或非違規(guī),由人工審核后提交系統(tǒng)保存。
(七)互聯(lián)網(wǎng)輿情監(jiān)測系統(tǒng):
網(wǎng)絡文學監(jiān)測系統(tǒng)針對互聯(lián)網(wǎng)中傳播的文學出版物,重點針對網(wǎng)絡小說、漫畫、有聲小說等。系統(tǒng)首先采用先進的網(wǎng)絡爬蟲與下載技術,在自動發(fā)現(xiàn)、下載、取證各類出版物內容的基礎上,然后充分利用涉黃涉暴圖像識別、字符識別、語音識別、文本比對等技術,對下載的相關網(wǎng)絡文學出版物內容進行智能化判定,實現(xiàn)主動高效的網(wǎng)絡文學監(jiān)測。系統(tǒng)自動對網(wǎng)站內的網(wǎng)絡文學出版物中是否含有違規(guī)內容進行分析研判與自動下載取證。系統(tǒng)自動對含有違規(guī)內容的網(wǎng)絡文學出版物進行持續(xù)監(jiān)測,以檢查違規(guī)內容的刪除情況,如未刪除,則督促其盡快刪除。系統(tǒng)自動對網(wǎng)絡文學出版物的傳播熱度、傳播違規(guī)內容等情況進行統(tǒng)計分析。
系統(tǒng)能夠實時搜集互聯(lián)網(wǎng)的海量輿情信息,包括各新聞門戶網(wǎng)站、論壇、博客、微博、貼吧、播客、各搜索引擎、微信公眾號、外媒、平媒等,也可定制本地化的目標網(wǎng)站,納入輿情采集范圍。
系統(tǒng)構建一個核心涉廣電輿情知識庫:具有完備的涉廣電輿情知識庫,內容涵蓋涉廣電人物、機構、政策法規(guī)、敏感節(jié)目、涉廣電微博賬號,涉廣電微信公眾號等各個方面。
系統(tǒng)基于成熟的輿情研判技術,自然語言處理技術(主要包括大規(guī)模文本排重、垃圾文本信息過濾、文本分類、聚類、文本情感分析、專題影響力分析、代表性話題聚類提取、人物/組織抽取技術),為互聯(lián)網(wǎng)輿情智能化的整理分析、統(tǒng)計編報提供有效的技術保障;
系統(tǒng)將情感分析技術與代表性話題提取技術相結合,統(tǒng)計分析網(wǎng)民對某輿情事件的褒貶傾向分布情況以及正負面代表性觀點,能夠幫助用戶更準確地了解關于某輿情專題的社情民意;
目前已廣泛應用于國家新聞出版廣電總局等各個輿情監(jiān)測領域。
(八)手機APP內容監(jiān)管系統(tǒng):
手機APP內容監(jiān)管系統(tǒng)綜合利用互聯(lián)網(wǎng)爬蟲、文本分析、語音識別、關鍵詞檢索等信息采集與分析技術,實現(xiàn)對手機APP中的文本(包括文章、帖文、評論等文本內容)、視聽節(jié)目內容進行自動采集抓取與分析,按照用戶的各種業(yè)務要求,主動發(fā)現(xiàn)手機APP中發(fā)布的違規(guī)內容。
(九)IPTV節(jié)目內容監(jiān)管系統(tǒng)解決方案:
系統(tǒng)支持來源合法性監(jiān)測和內容合法性檢測兩個核心功能。
(1)直播節(jié)目來源合法性監(jiān)測
分別在播控平臺出口②和用戶終端⑤分別對直播節(jié)目實時采集存儲后,通過音頻/視頻模版比對技術對直播節(jié)目進行比對分析,以及時發(fā)現(xiàn)直播節(jié)目中被非法篡改的節(jié)目,進而對直播節(jié)目的來源是否合法進行監(jiān)測。
(2)點播節(jié)目內容合法性監(jiān)測
在用戶終端⑤,對點播節(jié)目進行采集存儲,進行智能分析,以便自動發(fā)現(xiàn)非法的IPTV點播節(jié)目內容,例如判斷節(jié)目視頻中是否含有淫穢、暴力、反動、危害社會穩(wěn)定等各種違規(guī)內容。 |