このページでは、画像生成AI以外の生成AI・AI活用記事をまとめています。
Whisperによる音声認識、VoiceVoxを使った音声合成、Japanese-GPTやLlama2などのローカルLLM検証、自然言語処理の学習メモなどを整理しています。
画像生成AIが現在の発信の中心ですが、音声・文章・LLMの技術も、制作支援や情報発信のワークフローとつながる重要なテーマです。
音声認識・文字起こし
OpenAIのWhisperで日本語文字起こし環境構築と使用感
多言語AI音声認識モデルWhisperの使いこなし~インストールからWebUI実装まで
日本語音声認識モデルReazonSpeechでSpeech-to-Textの文字起こしを試してみた
音声認識Whisperと話者識別Pyannote.audioで議事録自動作成
音声合成・チャットボット
Japanese-GPT-1bのチャットボットをVoiceVoxのAPIでしゃべらせてみる
ローカルLLM・チャットボット
日本語特化GPT言語モデルJapanese-GPT-1bで簡単チャットボット
MetaのLlama2をローカル環境で動かしてみる(検証1)
ChatGPT / API活用
openAIなどのAPIキーをコントロールパネルの環境変数に登録して管理する
