その他の生成AIまとめ

スポンサーリンク

2026.05.122026.05.13

スポンサーリンク

このページでは、画像生成AI以外の生成AI・AI活用記事をまとめています。
Whisperによる音声認識、VoiceVoxを使った音声合成、Japanese-GPTやLlama2などのローカルLLM検証、自然言語処理の学習メモなどを整理しています。
画像生成AIが現在の発信の中心ですが、音声・文章・LLMの技術も、制作支援や情報発信のワークフローとつながる重要なテーマです。

目次

音声認識・文字起こし
音声合成・チャットボット
ローカルLLM・チャットボット
ChatGPT / API活用
自然言語処理の学習

音声認識・文字起こし

OpenAIのWhisperで日本語文字起こし環境構築と使用感

多言語AI音声認識モデルWhisperの使いこなし～インストールからWebUI実装まで

Whisper WebUIで動画の字幕を無料でつける方法

日本語音声認識モデルReazonSpeechでSpeech-to-Textの文字起こしを試してみた

音声認識Whisperと話者識別Pyannote.audioで議事録自動作成

音声合成・チャットボット

Japanese-GPT-1bのチャットボットをVoiceVoxのAPIでしゃべらせてみる

ローカルLLM・チャットボット

日本語特化GPT言語モデルJapanese-GPT-1bで簡単チャットボット

MetaのLlama2をローカル環境で動かしてみる（検証１）

ChatGPT / API活用

openAIなどのAPIキーをコントロールパネルの環境変数に登録して管理する

Pythonでのファイル読み書きまとめ

自然言語処理の学習

Pythonで自然言語処理ツールWordnetの辞書を使ってみる

MeCab解析結果から複合名詞の出現回数をカウント

東北大学の言語処理100本ノックを解く(1章～3章)