錯(cuò)別字檢測(cè)依靠語(yǔ)言模型來(lái)進(jìn)行漢語(yǔ)依存關(guān)系分析,通過(guò)對(duì)大量分類(lèi)語(yǔ)料中的上下文和語(yǔ)句關(guān)系進(jìn)行量化的統(tǒng)計(jì)、分析、提煉,并采用高倍信息壓縮、快速檢索、漢字高精度快速切分等先進(jìn)技術(shù)來(lái)生成語(yǔ)言模型和依存分析算法。
- 寫(xiě)作人員似是而非錯(cuò)誤
- 五筆字型錄入人員常見(jiàn)錯(cuò)誤
- 拼音錄入常見(jiàn)錯(cuò)誤
- OCR識(shí)別有規(guī)律的錯(cuò)誤
- 各專(zhuān)業(yè)廢除詞條
- 不規(guī)范科技計(jì)量單位
以官方文本為學(xué)習(xí)素材,依托自學(xué)習(xí)算法模型,匯聚形成敏感詞官方語(yǔ)料庫(kù)。并配套運(yùn)用文本分析法,按照業(yè)務(wù)規(guī)則設(shè)定質(zhì)檢機(jī)制,實(shí)現(xiàn)敏感文本信息的精準(zhǔn)識(shí)別。
- 落馬官員
- 暴力傾向
- 不文明用語(yǔ)
- 敏感政治傾向
對(duì)標(biāo)規(guī)范文本,對(duì)目標(biāo)內(nèi)容中的相關(guān)政治規(guī)范用語(yǔ)進(jìn)行全范圍識(shí)別,如從嚴(yán)治黨、黨史教育新時(shí)代社會(huì)主義等失范性表述以及領(lǐng)導(dǎo)姓名、領(lǐng)導(dǎo)職務(wù)排序等常識(shí)性問(wèn)題,從而進(jìn)一步規(guī)范化文本信息有關(guān)政治用語(yǔ)的準(zhǔn)確表達(dá)。
- 領(lǐng)導(dǎo)講話
- 官方文獻(xiàn)
- 上級(jí)發(fā)文
- 政治語(yǔ)錄
系統(tǒng)深諳行業(yè)規(guī)范用語(yǔ),注重行業(yè)規(guī)范,圍繞各行業(yè)領(lǐng)域?qū)W習(xí)積累大量規(guī)范性用語(yǔ),為維護(hù)行業(yè)用戶(hù)的專(zhuān)業(yè)性與權(quán)威性提供健全的行業(yè)規(guī)范用語(yǔ)檢測(cè)服務(wù)。
- 政務(wù)領(lǐng)域
- 稅務(wù)領(lǐng)域
- 煙草領(lǐng)域
- 教育領(lǐng)域
- 其他領(lǐng)域
通過(guò)內(nèi)容檢查構(gòu)建保護(hù)機(jī)制,擰緊個(gè)人隱私信息的“安全閥”,針對(duì)檢測(cè)出的個(gè)人隱私信息提供完善的分析報(bào)告以及精準(zhǔn)定位,方便后臺(tái)工作人員識(shí)別并用不同的脫敏規(guī)則進(jìn)行脫敏處理。
- 電話號(hào)碼
- 身份證號(hào)碼
- 銀行卡號(hào)碼
- 家庭住址
通過(guò)對(duì)比技術(shù)與內(nèi)容特征分析技術(shù),及時(shí)發(fā)現(xiàn)增加未知內(nèi)容、嵌入未知?jiǎng)赢?huà)或圖片等內(nèi)容篡改行為,保證政府網(wǎng)站發(fā)布的內(nèi)容得到有效保護(hù),保護(hù)政府網(wǎng)站免遭篡改的侵害。
- 網(wǎng)站頁(yè)面
- 文章內(nèi)容
- 網(wǎng)站圖片
- 域名劫持
以官方文本為學(xué)習(xí)素材,依托自學(xué)習(xí)算法模型,匯聚形成敏感詞官方語(yǔ)料庫(kù)。并配套運(yùn)用文本分析法,按照業(yè)務(wù)規(guī)則設(shè)定質(zhì)檢機(jī)制,實(shí)現(xiàn)敏感文本信息的精準(zhǔn)識(shí)別。
- 掛馬
- 暗鏈、死鏈
- 黃色網(wǎng)站
- 博彩網(wǎng)站