關於詞典

歡迎使用異體字詞典!

異體字詞典由廈門大學自然語言處理實驗室出品。不同於傳統異體字整理工作,我們藉助最新的自然語言處理技術,將古籍文本的統計信息和語義表示與現有的多種異體字字表相結合,輔之以人工編校,得到更適用於古文理解的異體字字典(詞典)。

目的:試圖囊括古籍所有異體字,爲學習研究古籍服務。目前僅限於UNICODE已收漢字。

特色

  1. 以詞明字。雖然古籍中單字詞多,多字詞也不少。而異體字的使用並非全無限制,有時僅局限於某些詞。所以我們采用詞典的形式,試圖收錄非完全同義異體字的典型使用情況。
  2. 收字全面。不但匯集權威字典(台灣異體字字典、中華大字典、中華字海)的異體字信息,也從古籍大數據中通過自然語言處理技術挖掘異體字信息。目前收字總數爲87861個,異體字總數超過7萬個。異體字收錄之全,超過目前所有字典。
  3. 機助人校。採用計算機自動編纂,輔以人工增補校勘。自創開放式詞典編輯環境,開網絡詞典合作編輯風氣之先。
  4. 旁徵博引。收異體詞超10萬條,例句超20萬句(此項數據僅供參考,會隨時變化),全部来自权威词典和数字化古籍。这些例证可幫助使用者更好地理解古籍。

 

聯繫我們

主頁http://nlp.xmu.edu.cn/

郵箱mandel@xmu.edu.cn

地址:福建省廈門市思明區曾厝垵西路廈門大學海韻園科研二414自然語言處理實驗室 361005


如果您使用該字典,請引用:

@inproceedings{shi2022variantsChiense,
  author = {Xiaodong Shi.},
  title = {Automatic construction of a dictionary of variant forms of Chinese characters.},
  publisher = {Chinese Language and Discourse},
  year = {2022},
  doi = {10.1075/cld.21037.shi. 2022}
}

注:如無法顯示某些漢字,請下載開心宋體(KaiXinSong),並安裝。