Registration info |
参加枠1 Free
FCFS
|
---|
Description
WAP NLP Tech Talk
株式会社ワークスアプリケーションズ・エンタープライズ 徳島人工知能NLP研究所が主催する自然言語処理に関する勉強会です。 第3回目はGiNZAの開発者であるMegagon Labsの松田寛さんをゲストにむかえGiNZAとSudachiPyの開発経緯、現状と今後の開発プランなどを紹介いたします。
今回もオンライン配信で実施します。自然言語処理の研究をされている方、ワークス徳島人工知能NLP研究所の活動に興味がある方、ぜひお気軽にご参加ください!
また、徳島人工知能NLP研究所を含めたワークスアプリケーションズ・エンタープライズのエンジニア向けの情報はこちらのTwitterアカウントからも今後発信していきます。
タイムテーブル
時間 | 内容 | 登壇者 |
---|---|---|
19:00~19:05 | 挨拶 | |
19:05~19:35 | 日本語形態素解析器SudachiPyの現状と今後について | ワークス徳島人工知能NLP研究所 山村 崇 |
19:35~20:05 | ELECTRA_UD_JapaneseにもとづくGiNZA-transformersの公開に向けて | Megagon Labs 松田 寛 |
20:05~20:30 | 質疑応答 | |
20:30 | 終了 |
登壇者
山村 崇 / ワークス徳島人工知能NLP研究所
発表テーマ
日本語形態素解析器SudachiPyの現状と今後について
概要: 形態素解析は、日本語テキスト処理を支える基本的かつ重要な技術である。 しかし、実応用として製品利用しようとした際,単語単位の不一致や表記揺れなど様々な問題がある。 そこで、我々はこれらの問題を改善するために形態素解析器「Sudachi」および「SudachiPy」を商用利用可能なライセンスのOSSとして公開し、継続的な改善・保守を続けている。 本発表では、中でもSudachiPyを題材に取り上げ,上記の問題を扱うためのSudachiPyの特徴的な機能について紹介する。 また、SudachiPyの現在の開発状況と今後どのような方向を目指して開発を行っているのかについても紹介する。
発表資料
プロフィール
2017年九州工業大学大学院博士前期課程修了.2020年同大大学院博士後期課程単位取得退学。 在学中は、複数人対話要約のためのアノテーション付きコーパスの構築を行い、2017年度の言語処理学会年次大会にて言語資源賞を受賞。 現在は、現職にて特定のドメインに特化した分散表現の研究開発の担当に従事。 また、OSSのメンテナーとして、日本語単語ベクトルchiVeや形態素解析器SudachiPy、同義語展開ツールchikkarpyの開発に携わる。
松田 寛 / Megagon Labs
発表テーマ
ELECTRA_UD_JapaneseにもとづくGiNZA-transformersの公開に向けて
発表資料
https://docs.google.com/presentation/d/1zOUTIXBdw8MhGqCdvq3wn0n2UCfQ99gpkQDsvjb-Xbs/edit?usp=sharing
プロフィール
Megagon Labs Japan, Research Scientist, 日本語依存解析器GiNZA開発リーダー
専門領域はSentence Embeddings、感情分析、ニューラル情報検索等。
奈良先端科学技術大学院大学で工学の修士号を取得後、ジャストシステムでビジネスキャリアを開始し、2002年から2010年までNLP研究部門をディレクション。その後、複数のスタートアップでフルスタックプログラマー、開発リーダー、データサイエンティストとしてサービスの立ち上げに貢献。Google Play Award、日本HRチャレンジ大賞等を受賞。 2018年夏にMegagon Labsへジョイン。
配信方法
zoomでの配信を予定しています。登録者へは開催前日までに視聴用URLをご連絡いたします。
ワークス徳島人工知能NLP研究所について
2017年2月に開設した自然言語処理に特化した研究開発機関です。 人工知能、特に自然言語処理を活用した業務効率化・生産性向上を実現し、新しい働き方を提案するための研究、サービス開発を実施しています。成果の一部は商用利用可能なライセンスのOSSとして公開しています。 https://www.worksap.co.jp/about/csr/nlp/activity/
その他、注意事項
- ご不明点・お困りごとなどございましたら、当イベントページの「イベントへのお問い合わせ」からご連絡ください
Media View all Media
If you add event media, up to 3 items will be shown here.