GMO Pepabo / AI Specialist

梁 震

AI Engineer

Crossing the boundary between language and speech with machine learning

Origin Beijing·Current Kyoto·PhD Student at Kyoto University

N 35.0116° · E 135.7681°

82.26 → 89.72%

ASR 医療用語リコール

医療音声 190 時間で LoRA 微調整・評価設計・学習運用(medimo)

×8speedup

形態素解析の高速化

−70%

コーパス作成工数の削減

97%

解析精度(語彙難易度判定)

190h

医療音声アノテーション

+40%

問い合わせ件数

About Me

Bridging Foreign Language Education and AI Technology

I am a master's-and-PhD researcher at Kyoto University working on educational applications of large language models (LLMs). At NINJAL (National Institute for Japanese Language and Linguistics) I led the Vocabulary Profiler project end-to-end, from requirements to deployment. From June 2025 I worked at medimo Inc. on improving medical-domain ASR accuracy and built a LangGraph-based prompt-generation pipeline, lifting medical-term ASR recall from 82.26% to 89.72%. From April 2026 I joined GMO Pepabo as an AI Specialist.

Kyoto University (M.A. completed, PhD candidate) ·github.com/ryoshin0830

Strengths

System design & developmentProject managementResearch & development (R&D)

Specialisation

Web Development

Full-stack delivery centred on Next.js / React / TypeScript / FastAPI / Node.js, owning the loop from requirements to deployment and operations.

ML & LLM Engineering

LoRA fine-tuning, agent design with LangChain / LangGraph, ASR improvement, multi-GPU training via DeepSpeed ZeRO, validation of LLM and multimodal models including stepaudio, phi4, Gemini.

Language Education Systems

Learner-corpus analysis, vocabulary difficulty estimation, automated test generation, extensive-reading platforms — built in close collaboration with classrooms and research institutes.

Specialization

  • ·Foreign Language Education, Second Language Acquisition, Applied Linguistics
  • ·Large Language Model (LLM) Fine-tuning and Development
  • ·Machine Learning for Vocabulary Difficulty Prediction and Language Assessment
  • ·Educational Grammar and English for Academic Purposes

Life Timeline

職務経歴

業務委託・正社員として担当した実装と研究開発

Contract = 業務委託、Personal = 個人プロダクト、Academic = 研究と区別。下記はすべて Contract または Full-time。

2026年4月 — 現在

2ヶ月

正社員

AI スペシャリスト職· 現任

GMO ペパボ株式会社 · IT・インターネット

新卒採用(OneCareer 経由)にて AI スペシャリスト職として参画

役割
AI スペシャリスト(正社員)
規模 / 体制
単独

担当フェーズ

要件定義基本設計詳細設計実装・開発

技術スタック

PythonLLMMachine Learning

担当業務

  • ·AI / LLM 領域でのプロダクト適用と研究開発

業務内容

  • ·ペパボ各サービスへの AI 機能組み込み・実証実験

2026年2月 — 2026年3月

2ヶ月

業務委託

情報通信工事入札 自動抽出・スコアリング PoC

株式会社 Sapeet · AI / SaaS

入札情報抽出 PoC を 2 ヶ月で立ち上げ、企業スコアリング基盤を整備

役割
AI エンジニア(業務委託)
規模 / 体制
単独

担当フェーズ

要件定義基本設計実装・開発テスト・レビュー

技術スタック

PythonLLM情報抽出多言語音声分析

担当業務

  • ·入札 PoC の範囲定義と抽出ロジックの設計・改善
  • ·システム構成・デプロイ運用・権限管理の設計

業務内容

  • ·情報通信工事入札情報の自動抽出パイプライン構築
  • ·企業スコアリングロジックの設計・実装
  • ·多言語発話の断片的記録の分類・分析
  • ·週次会議での開発進捗共有と抽出ロジック改善

2025年6月 — 2026年1月

8ヶ月

業務委託

医療カルテ自動生成 SaaS『medimo』

株式会社 medimo · 医療 / ヘルスケア AI

医療用語のリコールを 82.26% → 89.72% に改善(ASR 精度向上)

役割
AI エンジニア/要件定義〜設計主担当(業務委託)
規模 / 体制
全体 40 名 / チーム 25 名

担当フェーズ

要件定義基本設計詳細設計実装・開発テスト・レビュー

技術スタック

PythonFastAPITypeScriptReactLangGraphLangChainDifyPyTorchTransformersDeepSpeedAWS AuroraAWSDockerFigmaJupyter

担当業務

  • ·要件定義〜設計を主担当し、実装・コードレビューも担当
  • ·医師別カルテ様式(SOAP / 時系列 等)に対応するプロンプト自動生成機構の PoC / 設計 / 実装(LangGraph)
  • ·ASR の精度改善(医療音声アノテーション約 190 時間で LoRA 等の微調整、評価設計、学習運用)

業務内容

  • ·医師が過去カルテをアップロードすると様式に沿った要約形式を自動生成する仕様・要件を整理
  • ·LangGraph でプロンプト生成フローを設計・実装し、医師/施設ごとのテンプレートへ自動適用
  • ·プロンプト生成・検証を運用できるよう LangGraph 上で実行・管理導線を整備
  • ·FastAPI + React でプロンプト自動生成 UI および生成バックエンドを開発(開発者 3 名と協働)
  • ·stepaudio / phi4 / Gemini など LLM・マルチモーダルモデルの検証・比較
  • ·DeepSpeed(ZeRO 等)を用いたマルチ GPU 学習・実験手順を整備し、継続改善サイクルを運用

実績・成果

  • 医師ごとに都度作成していた要約プロンプト作成を自動化し、多様なカルテ様式へスケール可能な運用へ移行

2023年11月 — 2025年3月

1年5ヶ月

業務委託

語彙プロファイラー システム開発

国立国語研究所(NINJAL) · 研究プロジェクト

形態素解析の並列処理実装により処理速度を 8 倍向上(従来 5 分 → 10 秒以内)

役割
プロジェクトリーダー(業務委託)
規模 / 体制
全体 13 名 / チーム 6 名

担当フェーズ

要件定義基本設計詳細設計実装・開発保守・運用

技術スタック

JavaScriptTypeScriptReactNode.jsExpressPostgreSQLVercelAWSDocker

担当業務

  • ·プロジェクトリーダーとして要件定義から実装まで統括
  • ·React + Node.js によるダッシュボード構築
  • ·WebSocket を活用したリアルタイムデータ処理の実装

業務内容

  • ·チーム全体のマネジメントと技術選定
  • ·フロントエンド(React)とバックエンド(Node.js / Express)の設計・実装
  • ·形態素解析と語彙難易度判定システムの並列処理アーキテクチャ構築
  • ·PostgreSQL のデータベース設計とパフォーマンス最適化
  • ·SSL/TLS 認証とトークンベース認証によるセキュリティ強化

実績・成果

  • Word2Vec ベースの語彙難易度予測モデルを API として統合
  • 研究所の言語学者との協働で学術専門用語辞書(5,000 語)を構築
  • 予定より 2 週間早期納品を実現し、解析精度 97% を達成

2024年11月 — 2025年3月

5ヶ月

業務委託

LLM を活用した語彙難易度予測システム

機械学習研究プロジェクト · 研究支援・言語学ツール

言語処理学会で研究成果を発表(2022 年・2024 年)

役割
ML 研究開発(業務委託)
規模 / 体制
全体 3 名 / チーム 3 名

担当フェーズ

要件定義基本設計詳細設計実装・開発テスト・レビュー

技術スタック

PythonPyTorchTransformersScikit-learnMongoDBLinuxJupyterGitgensim

担当業務

  • ·Word2Vec による語彙テスト自動生成システム開発
  • ·LLM ファインチューニングによる語彙難易度予測モデル構築

業務内容

  • ·大規模日本語コーパスの前処理と Word2Vec モデル構築
  • ·Transformers ライブラリを活用した LLM ファインチューニング
  • ·機械学習パイプラインの設計と評価指標の実装

実績・成果

  • 国立国語研究所との共同研究による実用化

2024年10月 — 2024年11月

2ヶ月

業務委託

CurpusMaker — コーパス作成支援 Web アプリ

個人受託 · 研究支援・言語学ツール

コーパス作成の工数を従来手作業比で 70% 削減

役割
フルスタック(業務委託・単独)
規模 / 体制
全体 1 名 / チーム 1 名

担当フェーズ

要件定義基本設計詳細設計実装・開発テスト・レビュー保守・運用

技術スタック

JavaScriptTypeScriptReactNode.jsPDF.jsWebpackGit

担当業務

  • ·フルスタック開発(企画からデプロイまで全工程を単独担当)
  • ·PDF 解析・テキスト抽出機能の実装
  • ·ユーザーインターフェースの設計・開発

業務内容

  • ·React によるインタラクティブなフロントエンド開発
  • ·PDF.js を活用した PDF 解析機能
  • ·ユーザーが指定した範囲のテキスト抽出機能
  • ·Markdown 形式での出力機能
  • ·ドラッグ & ドロップによる直感的なファイルアップロード

実績・成果

  • 複数の PDF フォーマットに対応した高精度テキスト抽出を実現
  • レスポンシブデザインで PC・タブレット両対応

2024年4月 — 2024年5月

2ヶ月

業務委託

LandS — ニュージーランド向け日本語多読支援プラットフォーム

国際研究チーム · 教育 / 研究支援

500 名以上の学習者・100 名以上の同時接続に対応

役割
フルスタック(業務委託)
規模 / 体制
全体 17 名 / チーム 6 名

担当フェーズ

基本設計詳細設計実装・開発

技術スタック

TypeScriptNext.jsReactNode.jsPrismaPostgreSQLVercelAWSDockerJestFigma

担当業務

  • ·フルスタック開発(フロントエンド・バックエンド両方を担当)
  • ·リアルタイム読解時間計測システムの設計・実装
  • ·学習進捗分析ダッシュボードの開発

業務内容

  • ·Next.js App Router によるモダンな Web アプリケーション開発
  • ·PostgreSQL + Prisma ORM によるデータベース設計と最適化
  • ·ミリ秒精度でのリアルタイム読解時間計測機能
  • ·学習者レベル別テキスト配信システム
  • ·教師向け学習分析ダッシュボード(進捗可視化、理解度統計)
  • ·JWT 認証による安全な学習者・教師アカウント管理

実績・成果

  • CI/CD パイプライン構築で開発チーム 17 名の協働開発を効率化
  • A/B テスト機能実装により学習効果の定量的比較を可能化
  • 国際研究チームとの英語コミュニケーションを主導

2022年6月 — 2022年11月

6ヶ月

業務委託

公式 Web サイト開発(多言語対応)

株式会社 宸翰学園 · 教育

問い合わせ件数が従来サイト比で +40%

役割
フルスタック(業務委託)
規模 / 体制
全体 3 名 / チーム 2 名

担当フェーズ

要件定義基本設計詳細設計実装・開発テスト・レビュー保守・運用

技術スタック

PHPWordPressJavaScriptHTML/CSSMySQLLinuxApacheGit

担当業務

  • ·WordPress ベースの CMS サイト設計・開発
  • ·カスタムテーマ・プラグインの独自開発
  • ·多言語対応(日本語・中国語)サイト構築

業務内容

  • ·WordPress 環境の構築とカスタマイズ
  • ·PHP によるカスタム機能開発(問い合わせフォーム、コース管理システム)
  • ·レスポンシブデザインの実装と SEO 最適化
  • ·コンテンツ管理システムの構築と運用サポート
  • ·運用マニュアルの作成とクライアントへの操作研修

実績・成果

  • 日中多言語サイトの実装で日中両国の顧客層にリーチ

個人プロダクト

業務委託とは別軸で運用している個人開発・OSS・教育系プロダクト

Contract(業務委託)は『職務経歴』、Academic(研究)は『研究活動』、こちらは Personal / Product のみを掲載しています。

速読ゴリラ

日本語学習者向けのインタラクティブな速読練習システム

主な機能・特徴

  • ·初級から上級までレベル別のコンテンツ
  • ·リアルタイムの読書速度(WPM)と理解度測定
  • ·クイズ形式でのインタラクティブな学習
  • ·学習進捗の可視化と追跡

技術スタック

Next.jsTypeScriptTailwind CSSVercelPostgreSQL

日雨日語

効率的な日本語単語学習とリスニング練習を提供するモバイルアプリ

主な機能・特徴

  • ·React NativeとSwiftでクロスプラットフォーム対応
  • ·MongoDBによる柔軟なデータモデリング
  • ·AliCloudでのサーバーレス処理

技術スタック

React NativeSwiftNode.jsMongoDBAliCloud Function Compute

語彙プロファイラー「まつのは」

テキスト解析で単語の難易度を判定し、語彙レベルを可視化するウェブツール(個人版)

主な機能・特徴

  • ·Next.jsによるフルスタック開発
  • ·AWS Lambda上でのMeCab形態素解析
  • ·TypeScriptによる堅牢なコード設計

技術スタック

Next.jsAWS LambdaNode.jsVercel PostgresTypeScript

教育特化型LLM構築プロジェクト

外国語教育に特化した独自大規模言語モデルの開発。既存LLMの制約を回避した新しいアーキテクチャの研究開発。

主な機能・特徴

  • ·教育ドメイン特化のモデルアーキテクチャ設計
  • ·多言語対応の教育コンテンツ生成
  • ·学習者レベル適応型テキスト生成
  • ·評価指標の独自開発と検証

技術スタック

PyTorchTransformersHugging FaceCustom ArchitectureFine-tuning

語彙問題自動生成システム

Word2VecとLatent Dirichlet Allocation(LDA)を活用した日本語教育向け語彙問題の自動生成システム。分散表現とトピックモデリングによる高精度な誤答選択肢生成を実現。

主な機能・特徴

  • ·Word2Vec分散表現による意味的類似語の抽出
  • ·LDAトピックモデリングによる文脈的誤答選択肢生成
  • ·MeCab形態素解析による語彙難易度推定
  • ·機械学習による選択肢品質の自動評価

技術スタック

PythonWord2Vecscikit-learnGensimNLTKMeCab

テックリーダーシップ

アジャイル開発手法を導入し、CI/CDパイプライン構築、マイクロサービスアーキテクチャ設計、DevOps文化の醸成を主導。プロダクトマネジメントからテクニカルアーキテクチャまで包括的に統括。

Agile/ScrumCI/CDMicroservicesDevOpsProduct ManagementTechnical Architecture

Research

Innovation in AI Technology for Language Education

Books

  1. 2026

    English Language Education: Current Issues and Future Directions I

    Liang, Z. (Chapter Author)

    Springer Nature (Singapore) · Chapter Author

    View on Springer Nature Link

Publications & Presentations

  1. 2025

    A Study on Role Language in Manga Used in Daily Conversations: From the Perspective of Japanese Language Education

    Wang, F., Kanamaru, T., & Liang, Z.

    Kotoba, 46, pp. 55–72

  2. 2025

    Collocation Analysis of Authorized English Textbooks under the New Course of Study: From the Perspective of Continuity from Elementary to High School

    Nakano, T., & Liang, Z.

    JASELE 50th Saitama Research Conference

  3. 2024

    Analysis of High-Frequency Collocations Based on a Corpus of Authorized English Textbooks

    Nakano, T., Liang, Z., & Sasao, Y.

    JASELE 49th Fukuoka Research Conference

  4. 2024

    Can General-Purpose LLMs Predict Vocabulary Difficulty Based on Japanese Learner Data?

    Liang, Z., & Sasao, Y.

    Association for Natural Language Processing 2024

  5. 2023

    Development and Validation of an Audio-based Japanese Vocabulary Size Test for Japanese-Chinese Bilinguals

    Peng, Y., Liang, Z., & Sasao, Y.

    Japanese Language Education, 185, pp. 93–108

  6. 2023

    Motion and memory in VR: The influence of VR control method on memorization of foreign language orthography

    Vincent, N. H., Liang, Z., & Sasao, Y.

    International Journal on Cybernetics & Informatics (IJCI), 12(1), pp. 151–164

  7. 2022

    Subtitle Use in Japanese Learning through Visual Media: From the Perspective of Language Selection

    Peng, Y., Liang, Z., & Sasao, Y.

    Journal of Language and Cultural Education Research, 20, pp. 335–356

  8. 2022

    Development and Validation of an Audio-based Japanese Vocabulary Size Test for Japanese-Chinese Bilinguals

    Peng, Y., Liang, Z., & Sasao, Y.

    Society for Teaching Japanese as a Foreign Language Autumn Conference Proceedings

  9. 2022

    Development and Validation of an Automatic Distractor Generation Program for Japanese Vocabulary Questions

    Liang, Z., & Sasao, Y.

    Society for Teaching Japanese as a Foreign Language Spring Conference Proceedings

スキル・技術

業務で扱った技術スタック(経験年数付き)

プログラミング言語

JavaScript5yTypeScript3yPython5ySwift4yPHP3yC2y

フロントエンド

React3yNext.jsReact Native2yNode.js / ExpressFastAPILangChainLangGraphTransformersPyTorchDeepSpeedDifyWordPress

データベース

MariaDB / MySQL5yPostgreSQL3yMongoDB2yAWS Aurora

クラウド

Nginx6yApache5yLinux5yCaddy3yAWS3yVercelDocker

AI・機械学習

Git5yScikit-learn3yWord2Vec / gensimJupyterJestFigmaWebpackPDF.jsMeCabBERT

言語能力

  • 日本語JLPT N1 満点・ネイティブレベル
  • 中国語母国語(北京出身)
  • 英語CET Level 4・研究論文執筆レベル

資格・認定

  • 2020年

    JLPT N1(満点)

    日本語能力試験 - 最高レベルで満点取得

  • 2019年

    ICTプロフィシエンシー検定

    情報通信技術に関する資格

  • 2022年

    日本運転免許証

    日本で発行された普通自動車免許

  • 2018年

    中国運転免許証

    中国で発行された普通自動車免許

  • 2018年

    大学英語テスト4級

    中国の大学生向け全国英語能力試験

  • 2025年

    CATTI国際版 翻訳

    中日翻訳認定証 - 国際通用翻訳能力等級試験(CATTI国際版)

  • 2025年

    CATTI国際版 通訳

    中日通訳認定証 - 国際通用通訳能力等級試験(CATTI国際版)

Teaching Experience

Achievements as a Japanese Teacher

180/180

JLPT N1 Perfect Score

Perfect score at the highest level of the Japanese Language Proficiency Test

7

Years of Experience

5,000+

Teaching Hours

300+

Students

95%

JLPT Pass Rate

New Oriental Education & Technology Group

As a senior Japanese instructor at New Oriental, I developed and delivered comprehensive Japanese language education curricula to a wide range of students, from beginners to advanced learners aiming for JLPT N1.

Key Achievements

  • ·Developed original teaching materials and methodologies
  • ·Maintained 95% JLPT pass rate among students
  • ·Multiple Excellence in Teaching Awards

Specialties

  • ·JLPT N1-N5 All Levels Preparation
  • ·Business Japanese for Working Professionals
  • ·Conversation Skills Enhancement

Courses Offered

Basic Japanese Course

Foundational course for beginners starting their Japanese learning journey

  • ·Complete mastery of Hiragana and Katakana
  • ·Basic grammar pattern acquisition
  • ·Daily conversation skill development
  • ·Understanding of Japanese culture

JLPT Preparation Course

Comprehensive preparation for JLPT examinations across all levels

  • ·Vocabulary expansion based on target level
  • ·Complete grammar pattern mastery
  • ·Reading comprehension strategies
  • ·Listening skill enhancement

Business Japanese Course

Practical course focused on workplace communication

  • ·Business etiquette and honorifics (keigo)
  • ·Email and document writing skills
  • ·Meeting and presentation skills
  • ·Industry-specific terminology

Language learning is not just about memorizing words and grammar - it's about building bridges between cultures and opening doors to new opportunities. My goal is to make every student's learning journey both effective and enjoyable.

Teaching Philosophy

Open to contract work

Open to contract engagements

Available for contract work in medical AI, education AI and language processing — design, build and operations

Background in ASR, LLM and multimodal research and shipping. Comfortable owning from requirements, and used to working with research institutes. Get in touch.

Medical AI (ASR, LLM summarisation)Education AI (learner corpora, vocab difficulty)Language processing (multilingual pipelines, morphological analysis)
ryo.shin.j85@kyoto-u.jp

Development

Zenn

Messaging

Social

LIANG ZHEN (RYO SHIN) | AI Engineer & Researcher