GMO Pepabo / 工程师

梁 震

AI 工程师

用机器学习跨越语言与语音的边界

出生地 北京·现居 东京·京都大学博士

82.26 → 89.72%

ASR 医療用語リコール

医療向け音声認識(ASR)の精度改善で達成(medimo)

个人简介

融合外语教育学与 AI 技术

在京都大学研究生院的硕士课程与博士课程学习,研究大规模语言模型(LLM)的教育应用并取得博士学位。在国立国语研究所的语汇画像器开发中,一贯负责从需求定义到实现与运营。2025 年 6 月起加入株式会社 medimo,推进医疗语音识别(ASR)精度提升并构建基于 LangGraph 的提示词自动生成管线,将医学术语召回率从 82.26% 提升至 89.72%。2026 年 2 月参与株式会社 Sapeet 的招投标信息抽取 PoC。2026 年 4 月起作为工程师加入 GMO Pepabo。

京都大学研究生院(硕士毕业・博士毕业,已取得博士学位)

github.com/ryoshin0830

擅长业务

系统设计与开发项目管理研究开发(R&D)

擅长领域

Web 开发

以 Next.js / React / TypeScript / FastAPI / Node.js 为核心的全栈开发,从需求定义到部署运维一贯负责。

ML 与 LLM 工程

LoRA 微调、LangChain / LangGraph 智能体设计、ASR 改进、DeepSpeed ZeRO 多 GPU 训练,以及 stepaudio / phi4 / Gemini 等 LLM 与多模态模型的验证。

语言教育系统

学习者语料分析、词汇难度判定、自动出题系统、多读平台——长期与教育现场与研究机构协作开发。

专业领域

  • ·外语教育学・第二语言习得・应用语言学
  • ·大规模语言模型(LLM)的微调与构建
  • ·基于机器学习的词汇难度预测与语言评估
  • ·教育语法与学术英语教学

人生时间线

職務経歴

業務委託・正社員として担当した実装と研究開発

2026年4月 — 現在

正社員

エンジニア職· 現任

GMO ペパボ株式会社 · IT・インターネット

役割
エンジニア(正社員)
規模 / 体制
全社 362 名

2026年2月 — 2026年3月

業務委託

情報通信工事入札 自動抽出・スコアリング PoC

株式会社 Sapeet · AI / SaaS

入札情報抽出 PoC を立ち上げ、企業スコアリング基盤を整備

役割
AI エンジニア(業務委託)
規模 / 体制
全体 5 名 / チーム 5 名

担当フェーズ

要件定義基本設計実装・開発テスト・レビュー

技術スタック

PythonLLM情報抽出

担当業務

  • ·入札 PoC の範囲定義と抽出ロジックの設計・改善
  • ·システム構成・デプロイ運用・権限管理の設計

業務内容

  • ·情報通信工事入札情報の自動抽出パイプライン構築
  • ·企業スコアリングロジックの設計・実装
  • ·週次会議での開発進捗共有と抽出ロジック改善

2025年6月 — 2026年3月

業務委託

SUIREN — 日本語学習者向け速読練習プラットフォーム

Massey University(ニュージーランド) · 教育 / 研究支援

日本語学習者向けの速読練習プラットフォーム『SUIREN』(旧称:速読ゴリラ)を設計・開発

役割
フルスタック開発(業務委託)
規模 / 体制
全体 3 名 / チーム 3 名

担当フェーズ

要件定義基本設計詳細設計実装・開発保守・運用

技術スタック

Next.jsTypeScriptTailwind CSSVercelPostgreSQL

担当業務

  • ·Massey University・Dr. Mitsue Tabata-Sandom の日本語多読研究と連携し、速読練習プラットフォームを設計・開発
  • ·読書速度(WPM)・理解度の計測機能の設計・実装

業務内容

  • ·レベル別の速読コンテンツと出題フローの実装
  • ·リアルタイムの読書速度(WPM)と理解度測定
  • ·クイズ形式のインタラクティブ学習機能
  • ·学習進捗の可視化・追跡ダッシュボード

2025年6月 — 2026年1月

業務委託

医療カルテ自動生成 SaaS『medimo』

株式会社 medimo · 医療 / ヘルスケア AI

医療用語のリコールを 82.26% → 89.72% に改善(ASR 精度向上)

役割
AI エンジニア/要件定義〜設計主担当(業務委託)
規模 / 体制
全体 40 名 / チーム 25 名

担当フェーズ

要件定義基本設計詳細設計実装・開発テスト・レビュー

技術スタック

PythonFastAPITypeScriptReactLangGraphLangChainDifyPyTorchTransformersDeepSpeedAWS AuroraAWSDockerFigmaJupyter

担当業務

  • ·要件定義〜設計を主担当し、実装・コードレビューも担当
  • ·医師別カルテ様式(SOAP / 時系列 等)に対応するプロンプト自動生成機構の PoC / 設計 / 実装(LangGraph)
  • ·ASR の精度改善(医療音声アノテーション約 190 時間で LoRA 等の微調整、評価設計、学習運用)

業務内容

  • ·医師が過去カルテをアップロードすると様式に沿った要約形式を自動生成する仕様・要件を整理
  • ·LangGraph でプロンプト生成フローを設計・実装し、医師/施設ごとのテンプレートへ自動適用
  • ·プロンプト生成・検証を運用できるよう LangGraph 上で実行・管理導線を整備
  • ·FastAPI + React でプロンプト自動生成 UI および生成バックエンドを開発(開発者 3 名と協働)
  • ·stepaudio / phi4 / Gemini など LLM・マルチモーダルモデルの検証・比較
  • ·DeepSpeed(ZeRO 等)を用いたマルチ GPU 学習・実験手順を整備し、継続改善サイクルを運用

実績・成果

  • 医師ごとに都度作成していた要約プロンプト作成を自動化し、多様なカルテ様式へスケール可能な運用へ移行

2023年11月 — 2025年3月

業務委託

語彙プロファイラー システム開発

国立国語研究所(NINJAL) · 研究プロジェクト

国立国語研究所・松下達彦先生の語彙研究(『日本語を読むための語彙データベース』など)を基に、入力した日本語テキストの語彙を即時解析し、語彙難易度・使用頻度の観点で可視化する語彙プロファイラーを構築

役割
プロジェクトリーダー(業務委託)
規模 / 体制
全体 13 名 / チーム 6 名

担当フェーズ

要件定義基本設計詳細設計実装・開発保守・運用

技術スタック

JavaScriptTypeScriptReactNode.jsExpressPostgreSQLVercelAWSDocker

担当業務

  • ·プロジェクトリーダーとして要件定義から実装まで統括
  • ·React + Node.js によるダッシュボード構築
  • ·WebSocket を活用したリアルタイムデータ処理の実装

業務内容

  • ·チーム全体のマネジメントと技術選定
  • ·フロントエンド(React)とバックエンド(Node.js / Express)の設計・実装
  • ·形態素解析と語彙難易度判定のデータ処理パイプライン構築
  • ·PostgreSQL のデータベース設計とパフォーマンス最適化
  • ·SSL/TLS 認証とトークンベース認証によるセキュリティ強化

実績・成果

  • Word2Vec ベースの語彙難易度予測モデルを API として統合し、研究・教育現場で使いやすいプロファイル出力を実現

2022年6月 — 2022年11月

業務委託

公式 Web サイト開発(多言語対応)

株式会社 宸翰学園 · 教育

日中多言語サイトの実装で日中両国の顧客層にリーチ

役割
フルスタック(業務委託)
規模 / 体制
全体 3 名 / チーム 2 名

担当フェーズ

要件定義基本設計詳細設計実装・開発テスト・レビュー保守・運用

技術スタック

PHPWordPressJavaScriptHTML/CSSMySQLLinuxApacheGit

担当業務

  • ·WordPress ベースの CMS サイト設計・開発
  • ·カスタムテーマ・プラグインの独自開発
  • ·多言語対応(日本語・中国語)サイト構築

業務内容

  • ·WordPress 環境の構築とカスタマイズ
  • ·PHP によるカスタム機能開発(問い合わせフォーム、コース管理システム)
  • ·レスポンシブデザインの実装と SEO 最適化
  • ·コンテンツ管理システムの構築と運用サポート
  • ·運用マニュアルの作成とクライアントへの操作研修

個人プロダクト

業務委託とは別軸で運用している個人開発・OSS・教育系プロダクト

Contract(業務委託)は『職務経歴』、Academic(研究)は『研究活動』、こちらは Personal / Product のみを掲載しています。

語彙問題自動生成システム

Word2VecとLatent Dirichlet Allocation(LDA)を活用した日本語教育向け語彙問題の自動生成システム。分散表現とトピックモデリングによる高精度な誤答選択肢生成を実現。

主な機能・特徴

  • ·Word2Vec分散表現による意味的類似語の抽出
  • ·LDAトピックモデリングによる文脈的誤答選択肢生成
  • ·MeCab形態素解析による語彙難易度推定
  • ·機械学習による選択肢品質の自動評価

技術スタック

PythonWord2Vecscikit-learnGensimNLTKMeCab

研究活动

语言教育领域的 AI 技术创新

著作

  1. 2026

    英语教育:现状的课题与未来展望 I

    梁震(分担执笔)

    Springer Nature(新加坡) · 分担执笔

    在 Springer Nature Link 查看

论文与发表

  1. 2025

    关于日常会话中漫画角色语言的一点考察 ——从日语教育的视角出发——

    王芳、金丸敏幸、梁震

    ことば, 46, pp. 55–72

  2. 2025

    基于新学习指导要领的英语检定教科书搭配词分析——以小中高衔接为视角——

    中野珠悠、梁震

    全国英语教育学会(JASELE)第 50 届纪念埼玉研究大会

  3. 2024

    基于英语检定教科书语料的高频搭配词分析

    中野珠悠、梁震、笹尾洋介

    全国英语教育学会 JASELE 第 49 届福冈研究大会

  4. 2024

    通用语言模型能否基于日语学习者数据预测词汇难度?

    梁震、笹尾洋介

    言语处理学会 2024

  5. 2023

    面向中日双语者的日语语汇量测试音频版的开发与验证

    彭悦、梁震、笹尾洋介

    日语教育, 185, pp. 93–108

  6. 2023

    VR 中的运动与记忆:VR 操控方式对外语正字法记忆的影响

    Vincent, N. H., Liang, Z., & Sasao, Y.

    International Journal on Cybernetics & Informatics (IJCI), 12(1), pp. 151–164

  7. 2022

    日语学习中影像作品字幕的利用——基于语言选择的视角——

    彭悦、梁震、笹尾洋介

    语言文化教育研究, 20, pp. 335–356

  8. 2022

    面向中日双语者的日语语汇量测试音频版的开发与验证

    彭悦、梁震、笹尾洋介

    日语教育学会秋季大会预稿集

  9. 2022

    日语词汇问题选项自动生成程序的开发与验证

    梁震、笹尾洋介

    日语教育学会春季大会预稿集

スキル・技術

業務で扱った技術スタック(経験年数付き)

プログラミング言語

JavaScript5yTypeScript3yPython5ySwift4yPHP3yC2y

フロントエンド

React3yNext.jsReact Native2yNode.js / ExpressFastAPILangChainLangGraphTransformersPyTorchDeepSpeedDifyWordPress

データベース

MariaDB / MySQL5yPostgreSQL3yMongoDB2yAWS Aurora

クラウド

Nginx6yApache5yLinux5yCaddy3yAWS3yVercelDocker

AI・機械学習

Git5yScikit-learn3yWord2Vec / gensimJupyterJestFigmaWebpackPDF.jsMeCabBERT

言語能力

  • 日本語JLPT N1 満点・ネイティブレベル
  • 中国語母国語(北京出身)
  • 英語CET Level 4・研究論文執筆レベル

資格・認定

  • 2020年

    JLPT N1(満点)

    日本語能力試験 - 最高レベルで満点取得

  • 2019年

    ICTプロフィシエンシー検定

    情報通信技術に関する資格

  • 2022年

    日本運転免許証

    日本で発行された普通自動車免許

  • 2018年

    中国運転免許証

    中国で発行された普通自動車免許

  • 2018年

    大学英語テスト4級

    中国の大学生向け全国英語能力試験

  • 2025年

    CATTI国際版 翻訳

    中日翻訳認定証 - 国際通用翻訳能力等級試験(CATTI国際版)

  • 2025年

    CATTI国際版 通訳

    中日通訳認定証 - 国際通用通訳能力等級試験(CATTI国際版)

教学经验

作为日语教师的成就

180/180

JLPT N1 满分

在日语能力考试最高级别取得完美成绩

7

年经验

5,000+

小时指导

300+

名学生

95%

JLPT 合格率

新东方教育科技集团

在新东方担任资深日语讲师,为从初学者到备考 JLPT N1 的高级学员开发并提供综合性日语教学课程。

主要成就

  • ·开发原创教材与教学方法
  • ·保持 95% 学生 JLPT 合格率
  • ·多次荣获优秀讲师奖

专业领域

  • ·JLPT N1-N5 全级别备考
  • ·面向商务人士的商务日语
  • ·会话能力提升项目

提供课程

基础日语课程

面向开始日语学习的初学者的基础课程

  • ·完全掌握平假名和片假名
  • ·基本语法模式的掌握
  • ·日常会话技能的培养
  • ·日本文化的理解

JLPT 应试课程

全面支持各级别 JLPT 考试应对

  • ·根据目标级别强化词汇能力
  • ·完全掌握语法模式
  • ·提高阅读理解能力的策略
  • ·听力技能的强化

商务日语课程

专注于职场沟通的实用课程

  • ·商务礼仪与敬语
  • ·邮件与文书写作技能
  • ·会议与演讲能力
  • ·行业专业术语

语言学习不仅是背单词和语法,更是在不同文化之间架起桥梁、打开新机会之门。我的目标是让每个学生的学习之旅既有效又愉快。

教学理念

Open to contract work

业务委托咨询,欢迎随时联系

医疗 AI/教育 AI/语言处理领域,提供设计、实现到运维的一贯服务

具备 ASR / LLM / 多模态的研究与实施经验,擅长从需求定义开始的全流程合作,并与研究机构有长期协作经验。欢迎随时联系。

医疗 AI(ASR・LLM 摘要)教育 AI(学习者语料・词汇难度)语言处理(多语言管线・形态素分析)
ryo.shin.j85@kyoto-u.jp

开发

Zenn

消息

社交

梁震 | AI 工程师・研究者・日语教师