GMO ペパボ / AI スペシャリスト

梁 震

AI エンジニア

言語と音声の境界を、機械学習で越える

出身 北京·現在 京都·京都大学博士課程

N 35.0116° · E 135.7681°

82.26 → 89.72%

ASR 医療用語リコール

医療音声 190 時間で LoRA 微調整・評価設計・学習運用(medimo)

×8speedup

形態素解析の高速化

−70%

コーパス作成工数の削減

97%

解析精度(語彙難易度判定)

190h

医療音声アノテーション

+40%

問い合わせ件数

プロフィール

外国語教育学とAI技術の融合

京都大学大学院(修士・博士課程)で大規模言語モデル(LLM)の教育応用研究に従事。国立国語研究所では要件定義から実装まで一貫して担当しました。2025 年 6 月からは株式会社 medimo にて医療向け音声認識(ASR)の精度改善と LangGraph によるプロンプト自動生成基盤を構築し、ASR 医療用語リコールを 82.26% から 89.72% まで引き上げました。2026 年 4 月より GMO ペパボ AI スペシャリストとして参画。

京都大学大学院(修士課程修了・博士課程在籍) ·github.com/ryoshin0830

得意業務

システム設計・開発プロジェクトマネジメント研究開発(R&D)

得意分野

Web 開発

Next.js / React / TypeScript / FastAPI / Node.js を中心としたフルスタック開発。要件定義からデプロイ・運用まで一貫対応。

ML & LLM エンジニアリング

LoRA 微調整、LangChain / LangGraph によるエージェント設計、ASR 改善、DeepSpeed ZeRO のマルチ GPU 学習、stepaudio / phi4 / Gemini など LLM・マルチモーダル検証。

語学教育システム

学習者コーパス分析、語彙難易度判定、テスト自動生成、多読プラットフォーム。教育現場・研究機関との協働経験。

専門分野

  • ·外国語教育学・第二言語習得論・応用言語学
  • ·大規模言語モデル(LLM)のファインチューニング・構築
  • ·機械学習を用いた語彙難易度予測・言語評価
  • ·教育文法および学術目的の英語教育

人生のタイムライン

職務経歴

業務委託・正社員として担当した実装と研究開発

Contract = 業務委託、Personal = 個人プロダクト、Academic = 研究と区別。下記はすべて Contract または Full-time。

2026年4月 — 現在

1ヶ月

正社員

AI スペシャリスト職· 現任

GMO ペパボ株式会社 · IT・インターネット

新卒採用(OneCareer 経由)にて AI スペシャリスト職として参画

役割
AI スペシャリスト(正社員)
規模 / 体制
単独

担当フェーズ

要件定義基本設計詳細設計実装・開発

技術スタック

PythonLLMMachine Learning

担当業務

  • ·AI / LLM 領域でのプロダクト適用と研究開発

業務内容

  • ·ペパボ各サービスへの AI 機能組み込み・実証実験

2026年2月 — 2026年3月

2ヶ月

業務委託

情報通信工事入札 自動抽出・スコアリング PoC

株式会社 Sapeet · AI / SaaS

入札情報抽出 PoC を 2 ヶ月で立ち上げ、企業スコアリング基盤を整備

役割
AI エンジニア(業務委託)
規模 / 体制
単独

担当フェーズ

要件定義基本設計実装・開発テスト・レビュー

技術スタック

PythonLLM情報抽出多言語音声分析

担当業務

  • ·入札 PoC の範囲定義と抽出ロジックの設計・改善
  • ·システム構成・デプロイ運用・権限管理の設計

業務内容

  • ·情報通信工事入札情報の自動抽出パイプライン構築
  • ·企業スコアリングロジックの設計・実装
  • ·多言語発話の断片的記録の分類・分析
  • ·週次会議での開発進捗共有と抽出ロジック改善

2025年6月 — 2026年1月

8ヶ月

業務委託

医療カルテ自動生成 SaaS『medimo』

株式会社 medimo · 医療 / ヘルスケア AI

医療用語のリコールを 82.26% → 89.72% に改善(ASR 精度向上)

役割
AI エンジニア/要件定義〜設計主担当(業務委託)
規模 / 体制
全体 40 名 / チーム 25 名

担当フェーズ

要件定義基本設計詳細設計実装・開発テスト・レビュー

技術スタック

PythonFastAPITypeScriptReactLangGraphLangChainDifyPyTorchTransformersDeepSpeedAWS AuroraAWSDockerFigmaJupyter

担当業務

  • ·要件定義〜設計を主担当し、実装・コードレビューも担当
  • ·医師別カルテ様式(SOAP / 時系列 等)に対応するプロンプト自動生成機構の PoC / 設計 / 実装(LangGraph)
  • ·ASR の精度改善(医療音声アノテーション約 190 時間で LoRA 等の微調整、評価設計、学習運用)

業務内容

  • ·医師が過去カルテをアップロードすると様式に沿った要約形式を自動生成する仕様・要件を整理
  • ·LangGraph でプロンプト生成フローを設計・実装し、医師/施設ごとのテンプレートへ自動適用
  • ·プロンプト生成・検証を運用できるよう LangGraph 上で実行・管理導線を整備
  • ·FastAPI + React でプロンプト自動生成 UI および生成バックエンドを開発(開発者 3 名と協働)
  • ·stepaudio / phi4 / Gemini など LLM・マルチモーダルモデルの検証・比較
  • ·DeepSpeed(ZeRO 等)を用いたマルチ GPU 学習・実験手順を整備し、継続改善サイクルを運用

実績・成果

  • 医師ごとに都度作成していた要約プロンプト作成を自動化し、多様なカルテ様式へスケール可能な運用へ移行

2023年11月 — 2025年3月

1年5ヶ月

業務委託

語彙プロファイラー システム開発

国立国語研究所(NINJAL) · 研究プロジェクト

形態素解析の並列処理実装により処理速度を 8 倍向上(従来 5 分 → 10 秒以内)

役割
プロジェクトリーダー(業務委託)
規模 / 体制
全体 13 名 / チーム 6 名

担当フェーズ

要件定義基本設計詳細設計実装・開発保守・運用

技術スタック

JavaScriptTypeScriptReactNode.jsExpressPostgreSQLVercelAWSDocker

担当業務

  • ·プロジェクトリーダーとして要件定義から実装まで統括
  • ·React + Node.js によるダッシュボード構築
  • ·WebSocket を活用したリアルタイムデータ処理の実装

業務内容

  • ·チーム全体のマネジメントと技術選定
  • ·フロントエンド(React)とバックエンド(Node.js / Express)の設計・実装
  • ·形態素解析と語彙難易度判定システムの並列処理アーキテクチャ構築
  • ·PostgreSQL のデータベース設計とパフォーマンス最適化
  • ·SSL/TLS 認証とトークンベース認証によるセキュリティ強化

実績・成果

  • Word2Vec ベースの語彙難易度予測モデルを API として統合
  • 研究所の言語学者との協働で学術専門用語辞書(5,000 語)を構築
  • 予定より 2 週間早期納品を実現し、解析精度 97% を達成

2024年11月 — 2025年3月

5ヶ月

業務委託

LLM を活用した語彙難易度予測システム

機械学習研究プロジェクト · 研究支援・言語学ツール

言語処理学会で研究成果を発表(2022 年・2024 年)

役割
ML 研究開発(業務委託)
規模 / 体制
全体 3 名 / チーム 3 名

担当フェーズ

要件定義基本設計詳細設計実装・開発テスト・レビュー

技術スタック

PythonPyTorchTransformersScikit-learnMongoDBLinuxJupyterGitgensim

担当業務

  • ·Word2Vec による語彙テスト自動生成システム開発
  • ·LLM ファインチューニングによる語彙難易度予測モデル構築

業務内容

  • ·大規模日本語コーパスの前処理と Word2Vec モデル構築
  • ·Transformers ライブラリを活用した LLM ファインチューニング
  • ·機械学習パイプラインの設計と評価指標の実装

実績・成果

  • 国立国語研究所との共同研究による実用化

2024年10月 — 2024年11月

2ヶ月

業務委託

CurpusMaker — コーパス作成支援 Web アプリ

個人受託 · 研究支援・言語学ツール

コーパス作成の工数を従来手作業比で 70% 削減

役割
フルスタック(業務委託・単独)
規模 / 体制
全体 1 名 / チーム 1 名

担当フェーズ

要件定義基本設計詳細設計実装・開発テスト・レビュー保守・運用

技術スタック

JavaScriptTypeScriptReactNode.jsPDF.jsWebpackGit

担当業務

  • ·フルスタック開発(企画からデプロイまで全工程を単独担当)
  • ·PDF 解析・テキスト抽出機能の実装
  • ·ユーザーインターフェースの設計・開発

業務内容

  • ·React によるインタラクティブなフロントエンド開発
  • ·PDF.js を活用した PDF 解析機能
  • ·ユーザーが指定した範囲のテキスト抽出機能
  • ·Markdown 形式での出力機能
  • ·ドラッグ & ドロップによる直感的なファイルアップロード

実績・成果

  • 複数の PDF フォーマットに対応した高精度テキスト抽出を実現
  • レスポンシブデザインで PC・タブレット両対応

2024年4月 — 2024年5月

2ヶ月

業務委託

LandS — ニュージーランド向け日本語多読支援プラットフォーム

国際研究チーム · 教育 / 研究支援

500 名以上の学習者・100 名以上の同時接続に対応

役割
フルスタック(業務委託)
規模 / 体制
全体 17 名 / チーム 6 名

担当フェーズ

基本設計詳細設計実装・開発

技術スタック

TypeScriptNext.jsReactNode.jsPrismaPostgreSQLVercelAWSDockerJestFigma

担当業務

  • ·フルスタック開発(フロントエンド・バックエンド両方を担当)
  • ·リアルタイム読解時間計測システムの設計・実装
  • ·学習進捗分析ダッシュボードの開発

業務内容

  • ·Next.js App Router によるモダンな Web アプリケーション開発
  • ·PostgreSQL + Prisma ORM によるデータベース設計と最適化
  • ·ミリ秒精度でのリアルタイム読解時間計測機能
  • ·学習者レベル別テキスト配信システム
  • ·教師向け学習分析ダッシュボード(進捗可視化、理解度統計)
  • ·JWT 認証による安全な学習者・教師アカウント管理

実績・成果

  • CI/CD パイプライン構築で開発チーム 17 名の協働開発を効率化
  • A/B テスト機能実装により学習効果の定量的比較を可能化
  • 国際研究チームとの英語コミュニケーションを主導

2022年6月 — 2022年11月

6ヶ月

業務委託

公式 Web サイト開発(多言語対応)

株式会社 宸翰学園 · 教育

問い合わせ件数が従来サイト比で +40%

役割
フルスタック(業務委託)
規模 / 体制
全体 3 名 / チーム 2 名

担当フェーズ

要件定義基本設計詳細設計実装・開発テスト・レビュー保守・運用

技術スタック

PHPWordPressJavaScriptHTML/CSSMySQLLinuxApacheGit

担当業務

  • ·WordPress ベースの CMS サイト設計・開発
  • ·カスタムテーマ・プラグインの独自開発
  • ·多言語対応(日本語・中国語)サイト構築

業務内容

  • ·WordPress 環境の構築とカスタマイズ
  • ·PHP によるカスタム機能開発(問い合わせフォーム、コース管理システム)
  • ·レスポンシブデザインの実装と SEO 最適化
  • ·コンテンツ管理システムの構築と運用サポート
  • ·運用マニュアルの作成とクライアントへの操作研修

実績・成果

  • 日中多言語サイトの実装で日中両国の顧客層にリーチ

個人プロダクト

業務委託とは別軸で運用している個人開発・OSS・教育系プロダクト

Contract(業務委託)は『職務経歴』、Academic(研究)は『研究活動』、こちらは Personal / Product のみを掲載しています。

速読ゴリラ

日本語学習者向けのインタラクティブな速読練習システム

主な機能・特徴

  • ·初級から上級までレベル別のコンテンツ
  • ·リアルタイムの読書速度(WPM)と理解度測定
  • ·クイズ形式でのインタラクティブな学習
  • ·学習進捗の可視化と追跡

技術スタック

Next.jsTypeScriptTailwind CSSVercelPostgreSQL

日雨日語

効率的な日本語単語学習とリスニング練習を提供するモバイルアプリ

主な機能・特徴

  • ·React NativeとSwiftでクロスプラットフォーム対応
  • ·MongoDBによる柔軟なデータモデリング
  • ·AliCloudでのサーバーレス処理

技術スタック

React NativeSwiftNode.jsMongoDBAliCloud Function Compute

語彙プロファイラー「まつのは」

テキスト解析で単語の難易度を判定し、語彙レベルを可視化するウェブツール(個人版)

主な機能・特徴

  • ·Next.jsによるフルスタック開発
  • ·AWS Lambda上でのMeCab形態素解析
  • ·TypeScriptによる堅牢なコード設計

技術スタック

Next.jsAWS LambdaNode.jsVercel PostgresTypeScript

教育特化型LLM構築プロジェクト

外国語教育に特化した独自大規模言語モデルの開発。既存LLMの制約を回避した新しいアーキテクチャの研究開発。

主な機能・特徴

  • ·教育ドメイン特化のモデルアーキテクチャ設計
  • ·多言語対応の教育コンテンツ生成
  • ·学習者レベル適応型テキスト生成
  • ·評価指標の独自開発と検証

技術スタック

PyTorchTransformersHugging FaceCustom ArchitectureFine-tuning

語彙問題自動生成システム

Word2VecとLatent Dirichlet Allocation(LDA)を活用した日本語教育向け語彙問題の自動生成システム。分散表現とトピックモデリングによる高精度な誤答選択肢生成を実現。

主な機能・特徴

  • ·Word2Vec分散表現による意味的類似語の抽出
  • ·LDAトピックモデリングによる文脈的誤答選択肢生成
  • ·MeCab形態素解析による語彙難易度推定
  • ·機械学習による選択肢品質の自動評価

技術スタック

PythonWord2Vecscikit-learnGensimNLTKMeCab

テックリーダーシップ

アジャイル開発手法を導入し、CI/CDパイプライン構築、マイクロサービスアーキテクチャ設計、DevOps文化の醸成を主導。プロダクトマネジメントからテクニカルアーキテクチャまで包括的に統括。

Agile/ScrumCI/CDMicroservicesDevOpsProduct ManagementTechnical Architecture

研究活動

言語教育におけるAI技術の革新

著書

  1. 2026

    英語教育:現状の課題と将来展望 I

    梁 震(分担執筆)

    シュプリンガー・ネイチャー(シンガポール) · 分担執筆

    Springer Nature Link で見る

論文・発表

  1. 2025

    日常会話で使用されるマンガにおける役割語に関する一考察 ―日本語教育の視点から―

    王 芳, 金丸 敏幸, 梁 震

    ことば, 46, pp. 55–72

  2. 2025

    新学習指導要領に基づく英語検定教科書のコロケーション分析―小中高の連携の観点から―

    中野 珠悠・梁 震

    全国英語教育学会(JASELE)第50回記念埼玉研究大会

  3. 2024

    英語検定教科書コーパスに基づく高頻度コロケーションの分析

    中野 珠悠・梁 震・笹尾 洋介

    全国英語教育学会 JASELE 第49回福岡研究大会

  4. 2024

    汎用言語モデルは日本語学習者データに基づく語彙難易度を予測できるのか

    梁 震・笹尾 洋介

    言語処理学会2024

  5. 2023

    日中バイリンガルの音声版日本語語彙サイズテストの開発と検証

    彭 悦, 梁 震, 笹尾 洋介

    日本語教育, 185, pp. 93–108

  6. 2023

    Motion and memory in VR: The influence of VR control method on memorization of foreign language orthography

    Vincent, N. H., Liang, Z., & Sasao, Y.

    International Journal on Cybernetics & Informatics (IJCI), 12(1), pp. 151–164

  7. 2022

    日本語学習における映像作品の字幕利用ー言語選択の視点からー

    彭 悦, 梁 震, 笹尾 洋介

    言語文化教育研究, 20, pp. 335–356

  8. 2022

    日中バイリンガルの音声版日本語語彙サイズテストの開発と検証

    彭 悦・梁 震・笹尾 洋介

    日本語教育学会秋季大会予稿集

  9. 2022

    日本語語彙問題の選択肢自動生成プログラムの開発と検証

    梁 震・笹尾 洋介

    日本語教育学会春季大会予稿集

スキル・技術

業務で扱った技術スタック(経験年数付き)

プログラミング言語

JavaScript5yTypeScript3yPython5ySwift4yPHP3yC2y

フロントエンド

React3yNext.jsReact Native2yNode.js / ExpressFastAPILangChainLangGraphTransformersPyTorchDeepSpeedDifyWordPress

データベース

MariaDB / MySQL5yPostgreSQL3yMongoDB2yAWS Aurora

クラウド

Nginx6yApache5yLinux5yCaddy3yAWS3yVercelDocker

AI・機械学習

Git5yScikit-learn3yWord2Vec / gensimJupyterJestFigmaWebpackPDF.jsMeCabBERT

言語能力

  • 日本語JLPT N1 満点・ネイティブレベル
  • 中国語母国語(北京出身)
  • 英語CET Level 4・研究論文執筆レベル

資格・認定

  • 2020年

    JLPT N1(満点)

    日本語能力試験 - 最高レベルで満点取得

  • 2019年

    ICTプロフィシエンシー検定

    情報通信技術に関する資格

  • 2022年

    日本運転免許証

    日本で発行された普通自動車免許

  • 2018年

    中国運転免許証

    中国で発行された普通自動車免許

  • 2018年

    大学英語テスト4級

    中国の大学生向け全国英語能力試験

  • 2025年

    CATTI国際版 翻訳

    中日翻訳認定証 - 国際通用翻訳能力等級試験(CATTI国際版)

  • 2025年

    CATTI国際版 通訳

    中日通訳認定証 - 国際通用通訳能力等級試験(CATTI国際版)

教育経験

日本語教師としての実績

180/180

JLPT N1 満点

日本語能力試験最高レベルでの完璧な成績

7

年の経験

5,000+

時間の指導

300+

人の学生

95%

JLPT合格率

新東方教育科技集団

新東方でシニア日本語講師として、初級者からJLPT N1を目指す上級者まで、幅広いレベルの学生に包括的な日本語教育カリキュラムを開発・提供してきました。

主な実績

  • ·オリジナル教材・教授法の開発
  • ·95%の学生JLPT合格率を維持
  • ·優秀講師賞を複数回受賞

専門分野

  • ·JLPT N1〜N5全レベル対策
  • ·ビジネスパーソン向けビジネス日本語
  • ·会話力向上プログラム

提供コース

基礎日本語コース

日本語学習を始める初心者向けの基礎コース

  • ·ひらがな・カタカナの完全習得
  • ·基本文法パターンの習得
  • ·日常会話スキルの育成
  • ·日本文化の理解

JLPT対策コース

全レベルのJLPT試験対策を包括的にサポート

  • ·目標レベルに応じた語彙力強化
  • ·文法パターンの完全習得
  • ·読解力向上戦略
  • ·リスニングスキルの強化

ビジネス日本語コース

職場でのコミュニケーションに特化した実践コース

  • ·ビジネスマナーと敬語
  • ·メール・文書作成スキル
  • ·会議・プレゼンテーション能力
  • ·業界別専門用語

言語学習は単に単語や文法を暗記することではありません。文化間の架け橋を築き、新しい機会への扉を開くことです。私の目標は、すべての学生の学習ジャーニーを効果的で楽しいものにすることです。

教育理念

Open to contract work

業務委託のご相談、受け付けています

医療 AI / 教育 AI / 言語処理の領域で、設計から実装・運用までお手伝いします

ASR / LLM / マルチモーダルの研究と実装、要件定義からの伴走、研究機関との協働経験があります。お気軽にご連絡ください。

医療 AI(ASR・LLM 要約)教育 AI(学習者コーパス・語彙難易度)言語処理(多言語パイプライン・形態素解析)
ryo.shin.j85@kyoto-u.jp

開発

Zenn

メッセージ

ソーシャル

梁震(りょう しん)| AI エンジニア・研究者・日本語教師