在语料库语言学中词语搭配(Collocation)是指按顺序排列的单字或者术语同时出现的次数比偶然的多。在片语学(phraseology)中词语搭配是惯用片语(phraseme)的子类别。一个措辞上的词语搭配的例子,如韩礼德[1]提出的语言表达式strong tea(而不是*powerful tea)。
词语搭配这个词的定义在语言学界中是最受争论的之一[2]。
词语搭配在机器翻译等任务中能有所应用。而 Linggle[3]是全世界第一套词语搭配搜寻引擎。
用于搭配提取的公式[4]
此外,在[5]中罗列了84个可用于此任务的公式。
参考文献
- ↑ Halliday, M.A.K., 'Lexis as a Linguistic Level', Journal of Linguistics 2(1) 1966: 57-67
- ↑ Evert, S. Corpus Linguistics. An International Handbook. 2008.
- ↑ Joanne Boisson; Ting-Hui Kao, Jian-Cheng Wu, Tzu-Hsi Yen, Jason S. Chang. Linggle: a Web-scale Linguistic Search Engine for Words in Context. Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics. 2013.
- ↑ Manning, C. D. Foundations of statistical natural language processing. MIT Press. 1999.
- ↑ Pecina, P. An Extensive Empirical Study of Collocation Extraction Methods 43: 13. 2005.
这是一篇与语言或语言学相关的小作品。你可以通过编辑或修订扩充其内容。 |