Notice

关于NINJAL-LWP for TWC

《筑波网络语料库》(Tsukuba Web Corpus: TWC)是由网站所搜集的数据构建的大约有11亿词的语料库,而NINJAL-LWP for TWC(简称NLT)是该语料库的检索工具。检索工具采用的是由国立国语研究所(以下简称国语研)和Lago语言研究所共同开发的语料库检索系统NINJAL-LWP(NINJAL-LagoWordProfiler)。由国语研开发的总词数为1亿的《现代日语书面语平衡语料库》(Balanced Corpus of Contemporary Written Japanese: BCCWJ)的检索工具NINJAL-LWP for BCCWJ(NLB)也使用该系统。

该工具采用词汇分布概貌搜集(Lexical Profiling)手法,能够覆盖显示名词及动词等实词的共现关系及语法特征。