關於詞典
歡迎使用異體字詞典!
異體字詞典由廈門大學自然語言處理實驗室出品。不同於傳統異體字整理工作,我們藉助最新的自然語言處理技術,將古籍文本的統計信息和語義表示與現有的多種異體字字表相結合,輔之以人工編校,得到更適用於古文理解的異體字字典(詞典)。
目的:試圖囊括古籍所有異體字,爲學習研究古籍服務。目前僅限於UNICODE已收漢字。
特色:
- 以詞明字。雖然古籍中單字詞多,多字詞也不少。而異體字的使用並非全無限制,有時僅局限於某些詞。所以我們采用詞典的形式,試圖收錄非完全同義異體字的典型使用情況。
- 收字全面。不但匯集權威字典(台灣異體字字典、中華大字典、中華字海)的異體字信息,也從古籍大數據中通過自然語言處理技術挖掘異體字信息。目前收字總數爲87861個,異體字總數超過7萬個。異體字收錄之全,超過目前所有字典。
- 機助人校。採用計算機自動編纂,輔以人工增補校勘。自創開放式詞典編輯環境,開網絡詞典合作編輯風氣之先。
- 旁徵博引。收異體詞超10萬條,例句超20萬句(此項數據僅供參考,會隨時變化),全部来自权威词典和数字化古籍。这些例证可幫助使用者更好地理解古籍。
聯繫我們
地址:福建省廈門市思明區曾厝垵西路廈門大學海韻園科研二414自然語言處理實驗室 361005
如果您使用該字典,請引用: @inproceedings{shi2022variantsChiense,
author = {Xiaodong Shi.},
title = {Automatic construction of a dictionary of variant forms of Chinese characters.},
publisher = {Chinese Language and Discourse},
year = {2022},
doi = {10.1075/cld.21037.shi. 2022}
}
注:如無法顯示某些漢字,請下載開心宋體(KaiXinSong),並安裝。