Whisper Pythonで話者識別ライブラリPyannote.audioを使ってみる 会議などの議事録を作成するのに便利な話者識別ライブラリPyannote.audio(ピアノート・オーディオ)を使ってみました。GitHubでオープンソースとして公開されています。Whisperなどのspeak-to-textと組み合わせることにより、議事録を簡単に作成することができます。MITライセンスで公開されており、適切なライセンスと著作権表示をすることで、商用利用も可能です。 2023.01.28 Whisper
Whisper 多言語AI音声認識モデルWhisperの使いこなし~インストールからWebUI実装まで 多言語AI音声認識モデルWhisperのインストールから、各パラメータの意味、WebUIを使った環境構築など、Whisperの使いこなしをまとめ見ました。オープンソースで商用利用可能な高性能な文字起こしをご自分のPCに入れてみましょう! 2023.01.20 Whisper
AtCoder 競プロ典型90問 自習3 競プロ典型問題「003 - Longest Circular Road(★4)のPython自習解答記録:「グラフ」、「幅優先探索(BFS)」、「探索部分のクラス化」、「スタックの実装」 2023.01.08 AtCoder
自然言語処理 Japanese-GPT-1bのチャットボットをVoiceVoxのAPIでしゃべらせてみる transformersの日本語特化学習済み事前言語処理モデルJapanese-GPT-1bと音声合成APIのVoiceVoxを組み合わせて、しゃべるチャットボットを作成してみました。 2023.01.07 自然言語処理音声合成
自然言語処理 日本語特化GPT言語モデルJapanese-GPT-1bで簡単チャットボット Japanese-GPT-1bはrinna株式会社が公開している商用利用可能なMITライセンスで提供されている日本語言語モデルです。transformersの学習モデルに対して、適切な事前学習を実施することにより、前後の文脈に沿った自然な文章を作り出してくれます。今回は、Japanese-GPT-1bを使って簡単にチャットボットを作ってみます。パラメータ数は13億ということですので、今話題のGPT-3の先代のGPT-2レベルの日本語特化モデルという位置づけです。今回はそのモデルを直接使ってチャットボットを作成してみます。 2023.01.05 自然言語処理
環境構築 WSL2上のUbuntuでpython深層学習モデルtransformersを使ってみる Windowsでさっとtransformersの環境構築をする方法をメモで残します。chatGPTが話題の自然言語処理ですが、学習を開始するのはオープンソースのtransformersがお手軽です。今回はtransformersの環境構築から、使ってみるところまでやってみます。 2023.01.03 環境構築自然言語処理