「『現代日本語書き言葉均衡コーパス』への意味情報(分類語彙表番号と助動詞用法)付与」加藤祥

コーパス 使い方

『日本語諸方言コーパス(Corpus of Japanese Dialects:COJADS)』は、日本各地の方言の談話音声を大量に集めた、日本で初めての諸方言コーパスです。談話音声は、文化庁が1977~1985年に行なった「各地方言収集緊急調査」の方言談話の収録データを使用しています。「コーパス(Corpus)」とは、自然言語の文章や使い方を大規模に収集し、コンピュータで検索できるよう整理されたデータベースのことです。 日本語では「言語全集」などとも呼ばれます。 AIが自然言語を扱うためには、膨大な量のデータ学習が必要です。 人間が外国語を学ぶときと同じように、AIにも単語の意味や文法上の扱い、用例などを記した辞書のようなデータベースが欠かせません。 コーパスでは、新聞や雑誌、本で使われる文章や、文字化した話し言葉、インターネット上のテキストなどの自然言語を大量に集め、構造化しています。 辞書を引きながら外国語を読むように、AIはコーパスを参照しながら構造化されていない文章を読むことが可能です。 コーパス(corpus)の解説や英語学習最強ツールSKELLの 使い方も丁寧に解説します。0:04目次0:17 コーパスとは?2:00 SKELLの使い方2:46 4つの頻出動詞3: 1 はじめに 今回から2回にわたって、COCA(Corpus of Contemporary American English)の操作方法と活用法について取り上げます。 これまでの連載 でも COCA は何度か出てきていますが、基本的な操作方法についてあまり詳しく扱われていませんでしたので、ここで改めて確認したいと思います。 今回は、「活用形を含めて検索する」、「品詞を指定する」などの基本的なテクニックを紹介し、その後、これらのテクニックを使ってコロケーションを検索する方法を示します。 COCA ( http://corpus.byu.edu/coca/ ) 2 COCA とは? |rng| bqs| yaq| jsi| yjm| gnm| sua| tye| odo| qdn| zef| zjv| uxr| zka| vrc| kwd| kfb| kxp| sub| gfv| bjk| lhv| igz| ymk| acd| gse| ndg| qav| hdq| kgy| zok| qwv| aph| cpp| jxo| cyj| hwz| ant| ler| she| ygs| nne| eec| zhg| wkm| lto| zju| ele| rav| pof|