黒橋 禎夫
作家紹介

コーパス(英: corpus)は、言語学において、自然言語処理の研究に用いるため、自然言語の文章を構造化し大規模に集積したもの。構造化し、言語的な情報(品詞、統語構造など)を付与している。言語学以外では「全集」を意味することもあり、言語学でも日本語を扱う場合には、「言語全集」「名詞全集」「動詞全集」などと呼ぶとよい。コンピュータ利用が進み、電子化データとして提供されている。
登録作品数
1
読者数
1
人気の本

自然言語処理概論 (ライブラリ情報学コア・テキスト)
1人が読書中