GMO Pepabo / AI Specialist

梁 震

AI 工程师

用机器学习跨越语言与语音的边界

出生地 北京·现居 京都·京都大学博士研究生

N 35.0116° · E 135.7681°

82.26 → 89.72%

ASR 医療用語リコール

医療音声 190 時間で LoRA 微調整・評価設計・学習運用(medimo)

×8speedup

形態素解析の高速化

−70%

コーパス作成工数の削減

97%

解析精度(語彙難易度判定)

190h

医療音声アノテーション

+40%

問い合わせ件数

个人简介

融合外语教育学与 AI 技术

在京都大学硕博课程中从事大规模语言模型(LLM)的教育应用研究。在国立国语研究所的项目中一贯负责从需求定义到实施。2025 年 6 月起加入株式会社 medimo,推进医疗语音识别(ASR)精度提升与基于 LangGraph 的自动生成提示词管线,将医学术语 ASR 召回率从 82.26% 提升至 89.72%。2026 年 4 月起加入 GMO Pepabo 担任 AI Specialist。

京都大学研究生院(硕士毕业・博士在读) ·github.com/ryoshin0830

擅长业务

系统设计与开发项目管理研究开发(R&D)

擅长领域

Web 开发

以 Next.js / React / TypeScript / FastAPI / Node.js 为核心的全栈开发,从需求定义到部署运维一贯负责。

ML 与 LLM 工程

LoRA 微调、LangChain / LangGraph 智能体设计、ASR 改进、DeepSpeed ZeRO 多 GPU 训练,以及 stepaudio / phi4 / Gemini 等 LLM 与多模态模型的验证。

语言教育系统

学习者语料分析、词汇难度判定、自动出题系统、多读平台——长期与教育现场与研究机构协作开发。

专业领域

  • ·外语教育学・第二语言习得・应用语言学
  • ·大规模语言模型(LLM)的微调与构建
  • ·基于机器学习的词汇难度预测与语言评估
  • ·教育语法与学术英语教学

人生时间线

職務経歴

業務委託・正社員として担当した実装と研究開発

Contract = 業務委託、Personal = 個人プロダクト、Academic = 研究と区別。下記はすべて Contract または Full-time。

2026年4月 — 現在

2ヶ月

正社員

AI スペシャリスト職· 現任

GMO ペパボ株式会社 · IT・インターネット

新卒採用(OneCareer 経由)にて AI スペシャリスト職として参画

役割
AI スペシャリスト(正社員)
規模 / 体制
単独

担当フェーズ

要件定義基本設計詳細設計実装・開発

技術スタック

PythonLLMMachine Learning

担当業務

  • ·AI / LLM 領域でのプロダクト適用と研究開発

業務内容

  • ·ペパボ各サービスへの AI 機能組み込み・実証実験

2026年2月 — 2026年3月

2ヶ月

業務委託

情報通信工事入札 自動抽出・スコアリング PoC

株式会社 Sapeet · AI / SaaS

入札情報抽出 PoC を 2 ヶ月で立ち上げ、企業スコアリング基盤を整備

役割
AI エンジニア(業務委託)
規模 / 体制
単独

担当フェーズ

要件定義基本設計実装・開発テスト・レビュー

技術スタック

PythonLLM情報抽出多言語音声分析

担当業務

  • ·入札 PoC の範囲定義と抽出ロジックの設計・改善
  • ·システム構成・デプロイ運用・権限管理の設計

業務内容

  • ·情報通信工事入札情報の自動抽出パイプライン構築
  • ·企業スコアリングロジックの設計・実装
  • ·多言語発話の断片的記録の分類・分析
  • ·週次会議での開発進捗共有と抽出ロジック改善

2025年6月 — 2026年1月

8ヶ月

業務委託

医療カルテ自動生成 SaaS『medimo』

株式会社 medimo · 医療 / ヘルスケア AI

医療用語のリコールを 82.26% → 89.72% に改善(ASR 精度向上)

役割
AI エンジニア/要件定義〜設計主担当(業務委託)
規模 / 体制
全体 40 名 / チーム 25 名

担当フェーズ

要件定義基本設計詳細設計実装・開発テスト・レビュー

技術スタック

PythonFastAPITypeScriptReactLangGraphLangChainDifyPyTorchTransformersDeepSpeedAWS AuroraAWSDockerFigmaJupyter

担当業務

  • ·要件定義〜設計を主担当し、実装・コードレビューも担当
  • ·医師別カルテ様式(SOAP / 時系列 等)に対応するプロンプト自動生成機構の PoC / 設計 / 実装(LangGraph)
  • ·ASR の精度改善(医療音声アノテーション約 190 時間で LoRA 等の微調整、評価設計、学習運用)

業務内容

  • ·医師が過去カルテをアップロードすると様式に沿った要約形式を自動生成する仕様・要件を整理
  • ·LangGraph でプロンプト生成フローを設計・実装し、医師/施設ごとのテンプレートへ自動適用
  • ·プロンプト生成・検証を運用できるよう LangGraph 上で実行・管理導線を整備
  • ·FastAPI + React でプロンプト自動生成 UI および生成バックエンドを開発(開発者 3 名と協働)
  • ·stepaudio / phi4 / Gemini など LLM・マルチモーダルモデルの検証・比較
  • ·DeepSpeed(ZeRO 等)を用いたマルチ GPU 学習・実験手順を整備し、継続改善サイクルを運用

実績・成果

  • 医師ごとに都度作成していた要約プロンプト作成を自動化し、多様なカルテ様式へスケール可能な運用へ移行

2023年11月 — 2025年3月

1年5ヶ月

業務委託

語彙プロファイラー システム開発

国立国語研究所(NINJAL) · 研究プロジェクト

形態素解析の並列処理実装により処理速度を 8 倍向上(従来 5 分 → 10 秒以内)

役割
プロジェクトリーダー(業務委託)
規模 / 体制
全体 13 名 / チーム 6 名

担当フェーズ

要件定義基本設計詳細設計実装・開発保守・運用

技術スタック

JavaScriptTypeScriptReactNode.jsExpressPostgreSQLVercelAWSDocker

担当業務

  • ·プロジェクトリーダーとして要件定義から実装まで統括
  • ·React + Node.js によるダッシュボード構築
  • ·WebSocket を活用したリアルタイムデータ処理の実装

業務内容

  • ·チーム全体のマネジメントと技術選定
  • ·フロントエンド(React)とバックエンド(Node.js / Express)の設計・実装
  • ·形態素解析と語彙難易度判定システムの並列処理アーキテクチャ構築
  • ·PostgreSQL のデータベース設計とパフォーマンス最適化
  • ·SSL/TLS 認証とトークンベース認証によるセキュリティ強化

実績・成果

  • Word2Vec ベースの語彙難易度予測モデルを API として統合
  • 研究所の言語学者との協働で学術専門用語辞書(5,000 語)を構築
  • 予定より 2 週間早期納品を実現し、解析精度 97% を達成

2024年11月 — 2025年3月

5ヶ月

業務委託

LLM を活用した語彙難易度予測システム

機械学習研究プロジェクト · 研究支援・言語学ツール

言語処理学会で研究成果を発表(2022 年・2024 年)

役割
ML 研究開発(業務委託)
規模 / 体制
全体 3 名 / チーム 3 名

担当フェーズ

要件定義基本設計詳細設計実装・開発テスト・レビュー

技術スタック

PythonPyTorchTransformersScikit-learnMongoDBLinuxJupyterGitgensim

担当業務

  • ·Word2Vec による語彙テスト自動生成システム開発
  • ·LLM ファインチューニングによる語彙難易度予測モデル構築

業務内容

  • ·大規模日本語コーパスの前処理と Word2Vec モデル構築
  • ·Transformers ライブラリを活用した LLM ファインチューニング
  • ·機械学習パイプラインの設計と評価指標の実装

実績・成果

  • 国立国語研究所との共同研究による実用化

2024年10月 — 2024年11月

2ヶ月

業務委託

CurpusMaker — コーパス作成支援 Web アプリ

個人受託 · 研究支援・言語学ツール

コーパス作成の工数を従来手作業比で 70% 削減

役割
フルスタック(業務委託・単独)
規模 / 体制
全体 1 名 / チーム 1 名

担当フェーズ

要件定義基本設計詳細設計実装・開発テスト・レビュー保守・運用

技術スタック

JavaScriptTypeScriptReactNode.jsPDF.jsWebpackGit

担当業務

  • ·フルスタック開発(企画からデプロイまで全工程を単独担当)
  • ·PDF 解析・テキスト抽出機能の実装
  • ·ユーザーインターフェースの設計・開発

業務内容

  • ·React によるインタラクティブなフロントエンド開発
  • ·PDF.js を活用した PDF 解析機能
  • ·ユーザーが指定した範囲のテキスト抽出機能
  • ·Markdown 形式での出力機能
  • ·ドラッグ & ドロップによる直感的なファイルアップロード

実績・成果

  • 複数の PDF フォーマットに対応した高精度テキスト抽出を実現
  • レスポンシブデザインで PC・タブレット両対応

2024年4月 — 2024年5月

2ヶ月

業務委託

LandS — ニュージーランド向け日本語多読支援プラットフォーム

国際研究チーム · 教育 / 研究支援

500 名以上の学習者・100 名以上の同時接続に対応

役割
フルスタック(業務委託)
規模 / 体制
全体 17 名 / チーム 6 名

担当フェーズ

基本設計詳細設計実装・開発

技術スタック

TypeScriptNext.jsReactNode.jsPrismaPostgreSQLVercelAWSDockerJestFigma

担当業務

  • ·フルスタック開発(フロントエンド・バックエンド両方を担当)
  • ·リアルタイム読解時間計測システムの設計・実装
  • ·学習進捗分析ダッシュボードの開発

業務内容

  • ·Next.js App Router によるモダンな Web アプリケーション開発
  • ·PostgreSQL + Prisma ORM によるデータベース設計と最適化
  • ·ミリ秒精度でのリアルタイム読解時間計測機能
  • ·学習者レベル別テキスト配信システム
  • ·教師向け学習分析ダッシュボード(進捗可視化、理解度統計)
  • ·JWT 認証による安全な学習者・教師アカウント管理

実績・成果

  • CI/CD パイプライン構築で開発チーム 17 名の協働開発を効率化
  • A/B テスト機能実装により学習効果の定量的比較を可能化
  • 国際研究チームとの英語コミュニケーションを主導

2022年6月 — 2022年11月

6ヶ月

業務委託

公式 Web サイト開発(多言語対応)

株式会社 宸翰学園 · 教育

問い合わせ件数が従来サイト比で +40%

役割
フルスタック(業務委託)
規模 / 体制
全体 3 名 / チーム 2 名

担当フェーズ

要件定義基本設計詳細設計実装・開発テスト・レビュー保守・運用

技術スタック

PHPWordPressJavaScriptHTML/CSSMySQLLinuxApacheGit

担当業務

  • ·WordPress ベースの CMS サイト設計・開発
  • ·カスタムテーマ・プラグインの独自開発
  • ·多言語対応(日本語・中国語)サイト構築

業務内容

  • ·WordPress 環境の構築とカスタマイズ
  • ·PHP によるカスタム機能開発(問い合わせフォーム、コース管理システム)
  • ·レスポンシブデザインの実装と SEO 最適化
  • ·コンテンツ管理システムの構築と運用サポート
  • ·運用マニュアルの作成とクライアントへの操作研修

実績・成果

  • 日中多言語サイトの実装で日中両国の顧客層にリーチ

個人プロダクト

業務委託とは別軸で運用している個人開発・OSS・教育系プロダクト

Contract(業務委託)は『職務経歴』、Academic(研究)は『研究活動』、こちらは Personal / Product のみを掲載しています。

速読ゴリラ

日本語学習者向けのインタラクティブな速読練習システム

主な機能・特徴

  • ·初級から上級までレベル別のコンテンツ
  • ·リアルタイムの読書速度(WPM)と理解度測定
  • ·クイズ形式でのインタラクティブな学習
  • ·学習進捗の可視化と追跡

技術スタック

Next.jsTypeScriptTailwind CSSVercelPostgreSQL

日雨日語

効率的な日本語単語学習とリスニング練習を提供するモバイルアプリ

主な機能・特徴

  • ·React NativeとSwiftでクロスプラットフォーム対応
  • ·MongoDBによる柔軟なデータモデリング
  • ·AliCloudでのサーバーレス処理

技術スタック

React NativeSwiftNode.jsMongoDBAliCloud Function Compute

語彙プロファイラー「まつのは」

テキスト解析で単語の難易度を判定し、語彙レベルを可視化するウェブツール(個人版)

主な機能・特徴

  • ·Next.jsによるフルスタック開発
  • ·AWS Lambda上でのMeCab形態素解析
  • ·TypeScriptによる堅牢なコード設計

技術スタック

Next.jsAWS LambdaNode.jsVercel PostgresTypeScript

教育特化型LLM構築プロジェクト

外国語教育に特化した独自大規模言語モデルの開発。既存LLMの制約を回避した新しいアーキテクチャの研究開発。

主な機能・特徴

  • ·教育ドメイン特化のモデルアーキテクチャ設計
  • ·多言語対応の教育コンテンツ生成
  • ·学習者レベル適応型テキスト生成
  • ·評価指標の独自開発と検証

技術スタック

PyTorchTransformersHugging FaceCustom ArchitectureFine-tuning

語彙問題自動生成システム

Word2VecとLatent Dirichlet Allocation(LDA)を活用した日本語教育向け語彙問題の自動生成システム。分散表現とトピックモデリングによる高精度な誤答選択肢生成を実現。

主な機能・特徴

  • ·Word2Vec分散表現による意味的類似語の抽出
  • ·LDAトピックモデリングによる文脈的誤答選択肢生成
  • ·MeCab形態素解析による語彙難易度推定
  • ·機械学習による選択肢品質の自動評価

技術スタック

PythonWord2Vecscikit-learnGensimNLTKMeCab

テックリーダーシップ

アジャイル開発手法を導入し、CI/CDパイプライン構築、マイクロサービスアーキテクチャ設計、DevOps文化の醸成を主導。プロダクトマネジメントからテクニカルアーキテクチャまで包括的に統括。

Agile/ScrumCI/CDMicroservicesDevOpsProduct ManagementTechnical Architecture

研究活动

语言教育领域的 AI 技术创新

著作

  1. 2026

    英语教育:现状的课题与未来展望 I

    梁震(分担执笔)

    Springer Nature(新加坡) · 分担执笔

    在 Springer Nature Link 查看

论文与发表

  1. 2025

    关于日常会话中漫画角色语言的一点考察 ——从日语教育的视角出发——

    王芳、金丸敏幸、梁震

    ことば, 46, pp. 55–72

  2. 2025

    基于新学习指导要领的英语检定教科书搭配词分析——以小中高衔接为视角——

    中野珠悠、梁震

    全国英语教育学会(JASELE)第 50 届纪念埼玉研究大会

  3. 2024

    基于英语检定教科书语料的高频搭配词分析

    中野珠悠、梁震、笹尾洋介

    全国英语教育学会 JASELE 第 49 届福冈研究大会

  4. 2024

    通用语言模型能否基于日语学习者数据预测词汇难度?

    梁震、笹尾洋介

    言语处理学会 2024

  5. 2023

    面向中日双语者的日语语汇量测试音频版的开发与验证

    彭悦、梁震、笹尾洋介

    日语教育, 185, pp. 93–108

  6. 2023

    VR 中的运动与记忆:VR 操控方式对外语正字法记忆的影响

    Vincent, N. H., Liang, Z., & Sasao, Y.

    International Journal on Cybernetics & Informatics (IJCI), 12(1), pp. 151–164

  7. 2022

    日语学习中影像作品字幕的利用——基于语言选择的视角——

    彭悦、梁震、笹尾洋介

    语言文化教育研究, 20, pp. 335–356

  8. 2022

    面向中日双语者的日语语汇量测试音频版的开发与验证

    彭悦、梁震、笹尾洋介

    日语教育学会秋季大会预稿集

  9. 2022

    日语词汇问题选项自动生成程序的开发与验证

    梁震、笹尾洋介

    日语教育学会春季大会预稿集

スキル・技術

業務で扱った技術スタック(経験年数付き)

プログラミング言語

JavaScript5yTypeScript3yPython5ySwift4yPHP3yC2y

フロントエンド

React3yNext.jsReact Native2yNode.js / ExpressFastAPILangChainLangGraphTransformersPyTorchDeepSpeedDifyWordPress

データベース

MariaDB / MySQL5yPostgreSQL3yMongoDB2yAWS Aurora

クラウド

Nginx6yApache5yLinux5yCaddy3yAWS3yVercelDocker

AI・機械学習

Git5yScikit-learn3yWord2Vec / gensimJupyterJestFigmaWebpackPDF.jsMeCabBERT

言語能力

  • 日本語JLPT N1 満点・ネイティブレベル
  • 中国語母国語(北京出身)
  • 英語CET Level 4・研究論文執筆レベル

資格・認定

  • 2020年

    JLPT N1(満点)

    日本語能力試験 - 最高レベルで満点取得

  • 2019年

    ICTプロフィシエンシー検定

    情報通信技術に関する資格

  • 2022年

    日本運転免許証

    日本で発行された普通自動車免許

  • 2018年

    中国運転免許証

    中国で発行された普通自動車免許

  • 2018年

    大学英語テスト4級

    中国の大学生向け全国英語能力試験

  • 2025年

    CATTI国際版 翻訳

    中日翻訳認定証 - 国際通用翻訳能力等級試験(CATTI国際版)

  • 2025年

    CATTI国際版 通訳

    中日通訳認定証 - 国際通用通訳能力等級試験(CATTI国際版)

教学经验

作为日语教师的成就

180/180

JLPT N1 满分

在日语能力考试最高级别取得完美成绩

7

年经验

5,000+

小时指导

300+

名学生

95%

JLPT 合格率

新东方教育科技集团

在新东方担任资深日语讲师,为从初学者到备考 JLPT N1 的高级学员开发并提供综合性日语教学课程。

主要成就

  • ·开发原创教材与教学方法
  • ·保持 95% 学生 JLPT 合格率
  • ·多次荣获优秀讲师奖

专业领域

  • ·JLPT N1-N5 全级别备考
  • ·面向商务人士的商务日语
  • ·会话能力提升项目

提供课程

基础日语课程

面向开始日语学习的初学者的基础课程

  • ·完全掌握平假名和片假名
  • ·基本语法模式的掌握
  • ·日常会话技能的培养
  • ·日本文化的理解

JLPT 应试课程

全面支持各级别 JLPT 考试应对

  • ·根据目标级别强化词汇能力
  • ·完全掌握语法模式
  • ·提高阅读理解能力的策略
  • ·听力技能的强化

商务日语课程

专注于职场沟通的实用课程

  • ·商务礼仪与敬语
  • ·邮件与文书写作技能
  • ·会议与演讲能力
  • ·行业专业术语

语言学习不仅是背单词和语法,更是在不同文化之间架起桥梁、打开新机会之门。我的目标是让每个学生的学习之旅既有效又愉快。

教学理念

Open to contract work

业务委托咨询,欢迎随时联系

医疗 AI/教育 AI/语言处理领域,提供设计、实现到运维的一贯服务

具备 ASR / LLM / 多模态的研究与实施经验,擅长从需求定义开始的全流程合作,并与研究机构有长期协作经验。欢迎随时联系。

医疗 AI(ASR・LLM 摘要)教育 AI(学习者语料・词汇难度)语言处理(多语言管线・形态素分析)
ryo.shin.j85@kyoto-u.jp

开发

Zenn

消息

社交

梁震 | AI 工程师・研究者・日语教师