スポンサーリンク
自然言語処理

東北大学の言語処理100本ノックを解く(1章~3章)

東北大学知能情報科学講座の自然言語処理学分野の乾・鈴木研究室の新人教育に使われている言語処理100本ノックを解いてみます。現東京工業大学の岡崎教授が作った自然言語の問題集で、2023年2月現在、一般に公開されており、解くだけで自然言語処理の基本がわかってしまうというとても優れものです。いろいろ調べながらやってみましたが、なかなか難易度が高くて骨が折れます。こういうのを研究室で受け継いでいくのってうらやましいです。
Stable Diffusion

CPUでサクサク動く画像補正ツールlama-cleanerで画像から不要なものを消去

画像補正ツールlama-cleanerを紹介します。導入も簡単で、CPU環境でも十分動作可能です。デフォルトで設定されているLama以外にも、GPU環境が必要となりますが、Stable Diffusion1.5などの他のinpaintツールも利用可能です。びっくりする高性能ですが、無償で使える上に、Apach-2.0のライセンスで提供されており、商用利用や再配布も可能です。
化学ツール

分子の化学構造を文字列で表すSMILES記法まとめ

SMILES (Simplified Molecular Input Line Entry System)は、分子の化学構造を文字列形式で表現する方法です。各要素を文字記号で表し、結合関係を括弧や文字で表すことで分子を表します。SMILESは、分子をコンピュータ上で処理する際に便利な形式であり、化学データベースの検索や計算などに利用されています。
Whisper

日本語音声認識モデルReazonSpeechでSpeech-to-Textの文字起こしを試してみた

ReazonSpeechは日本のレアゾン・ヒューマンインタラクション研究所が開発した約19,000時間のラベル付き日本語音声コーパスで、そのコーパスから学習されたSpeech-to-TextのESPnetモデルが公開されています。日本語に特化して学習することで、少ないパラメータ数でもOpenAIのWhisperのlargeモデルに匹敵する文字起こしの精度を達成しているとのことです。Apache-2.0のライセンスで公開されており、商用利用や再配布可能な柔軟なライセンスのモデルが提供されています。
Whisper

Pythonライブラリpydudで直感的なオーディオファイル加工

Pythonライブラリpydudでwavファイルやmp3などの様々な音声ファイルの加工をしてみます。ffmpegベースで作動するため、様々な音声コーデックに対応し、このライブラリで様々なことができます。音声ファイルの解析の前処理などでは欠かせないライブラリです。
Whisper

音声認識Whisperと話者識別Pyannote.audioで議事録自動作成

Pythonの音声認識ライブラリWhisperと話者識別ライブラリPyannote.audioで面倒な議事録の自動作成をしてみます。WhisperはOpenAIからMITライセンスで提供されています。Pyannote.audioもMITライセンスで提供されています。いずれも適切なライセンス表示下で改変、配布、商用利用が認められており、非常に使いやすいライブラリです。
Whisper

Pythonで話者識別ライブラリPyannote.audioを使ってみる

会議などの議事録を作成するのに便利な話者識別ライブラリPyannote.audio(ピアノート・オーディオ)を使ってみました。GitHubでオープンソースとして公開されています。Whisperなどのspeak-to-textと組み合わせることにより、議事録を簡単に作成することができます。MITライセンスで公開されており、適切なライセンスと著作権表示をすることで、商用利用も可能です。
Whisper

多言語AI音声認識モデルWhisperの使いこなし~インストールからWebUI実装まで

多言語AI音声認識モデルWhisperのインストールから、各パラメータの意味、WebUIを使った環境構築など、Whisperの使いこなしをまとめ見ました。オープンソースで商用利用可能な高性能な文字起こしをご自分のPCに入れてみましょう!
AtCoder

競プロ典型90問 自習3

競プロ典型問題「003 - Longest Circular Road(★4)のPython自習解答記録:「グラフ」、「幅優先探索(BFS)」、「探索部分のクラス化」、「スタックの実装」
自然言語処理

Japanese-GPT-1bのチャットボットをVoiceVoxのAPIでしゃべらせてみる

transformersの日本語特化学習済み事前言語処理モデルJapanese-GPT-1bと音声合成APIのVoiceVoxを組み合わせて、しゃべるチャットボットを作成してみました。
自然言語処理

日本語特化GPT言語モデルJapanese-GPT-1bで簡単チャットボット

Japanese-GPT-1bはrinna株式会社が公開している商用利用可能なMITライセンスで提供されている日本語言語モデルです。transformersの学習モデルに対して、適切な事前学習を実施することにより、前後の文脈に沿った自然な文章を作り出してくれます。今回は、Japanese-GPT-1bを使って簡単にチャットボットを作ってみます。パラメータ数は13億ということですので、今話題のGPT-3の先代のGPT-2レベルの日本語特化モデルという位置づけです。今回はそのモデルを直接使ってチャットボットを作成してみます。
環境構築

WSL2上のUbuntuでpython深層学習モデルtransformersを使ってみる

Windowsでさっとtransformersの環境構築をする方法をメモで残します。chatGPTが話題の自然言語処理ですが、学習を開始するのはオープンソースのtransformersがお手軽です。今回はtransformersの環境構築から、使ってみるところまでやってみます。
PyTorch

WSL2のUbuntu上にPyTorchとGPU環境構築

今回は、WSL2のUbuntu上にPyTorchとGPU環境構築の方法についてまとめてみました。
環境構築

WindowsのUbuntu上にvirtualenvでPython仮想環境構築

Windowsのネイティブ環境では構築がうまくいかない場合もあります。今回はUbuntu上で新しいPython開発環境を設定する方法をまとめます。
環境構築

VOICEVOXエンジンを使ったPythonでの「高」品質音声合成API

VOICEVOXは、商用利用が可能である無料のテキスト読み上げソフトです。ホームページ上では中品質と言われていますが、実際にはかなりの高品質の読み上げソフトです。今回はVOICEVOXエンジンを実装して、そのAPIを使ってみることにします。
Python基礎

Pythonでのファイル読み書きまとめ

chatGPTにPythonでのファイルの読み書きについて詳しく教えてもらいましたので、その結果をまとめます。
Python基礎

WindowsへのPythonローカル環境構築のおすすめの方法

この記事は、Windows上でPythonを使うためのローカル環境を構築する方法を紹介しています。趣味でPythonプログラミングをする方にご参考にしていただければと思います。PowerShellのアップデート、Python本体のインストール、Visual Studio Codeのインストールを行います。
AtCoder

競プロ典型90問 自習2

競プロ典型問題「002 - Encyclopedia of Parentheses(★3)」のPython自習解答記録:「ビット表記」、「正しいかっこ列の条件」
AtCoder

競プロ典型90問 自習1

競プロ典型問題「001 - Yokan Party(★4)」のPython自習解答記録:「二分探索」、「分割可否の判定」
PyTorch

WebUIでStable Diffusion 1からの手順

WebUI(AUTOMATIC1111)でStable Diffusionを動かしてみます。比較的軽い環境で動くので、folk版のStable Difuusionしか動かなくても使える可能性はあります。今回は1から導入の手順をまとめました。
Stable Diffusion

Stable Diffusion Pipelineまとめ(1)text2img

Stable Diffusion Pipelineを公式ページをChatGPTの解説にしてもらいながらかみくだきました。パラメータの意味などをしっかり理解すると生成する画像の意味もよく理解できます。
Stable Diffusion

Stable Diffusionのモデルをローカルに保存

Stable Diffusionのモデルは、デフォルトでは実行時にwebからダウンロードされ、キャッシュに保存されます。2度目以降は、キャッシュから使用されますが、ローカルで安定してStable Diffusionを使用するために、特定の場所に保存する方法をまとめました。
Stable Diffusion

Stable Diffusion 2で高画質画像生成

Stable Diffusion2での画像生成に挑戦してみます。以前のv1に比べて、高解像度の768x768に対応した新しい安定拡散モデルを用いて、高画質の画像生成が可能になっているそうです。
PyTorch

WindowsネイティブへのCUDA, PyTorchの環境構築

WindowsネイティブへのCUDA、Pytorchの環境構築をまとめます。PyTorchは今機械学習の世界で最も使われているフレームワークの一つです。導入難易度も、TensorFlowよりも低めとのことです。今回はWindowsネイティブへの環境構築を行っていきます。
Python基礎

Pythonで自作モジュール,パッケージを使いこなす

モジュールやパッケージの使い方をまとめました。自作モジュールは大きなプログラムを書く上で重要になります。また、標準モジュールや配布されているスクリプトの理解にも非常に重要な知識です。
TensorFlow

WindowsのWSL上でGPUのTensorFlow環境構築

NVIDIAのGPUマシンにWindowsのWSL上にCUDA、cuDNNをインストールして、TensorFlowの機械学習の計算環境を構築します。
環境構築

WSL上にソースコードからMeCabをインストール

Windows上で形態素解析エンジンMeCabを使うにはWindows版のMeCabをインストールする方法と、DocekerやWSLなどの仮想環境のLinux上でmecabをインストールする方法があります。今回は、WSLでソースコードからM...
環境構築

WindowsのWSL上のUbuntuを複製する

WindowsのWSL上でUbuntuの環境を複製し、複数のUbuntu環境を使う方法をまとめます。WindowsのWSL2で作成したUbuntuでは、実験的な環境構築をしてみたくなることがあるかもしれません。今回は既存のWSL2のUbuntu環境を維持したまま、複製して実験的に使えるUbuntu環境を作成してみます。
環境構築

WindowsでGitとGitHubを使う

WindowsでGitとGit-Hubの基本的な使い方をまとめていきます。Gitは作成したプログラムのソースコードなどの変更履歴を管理するアプリです。Gitでは、それぞれの変更履歴ごとにリポジトリと呼ばれる場所にファイルの状態を保存することによって、バージョンを管理し、複数人での共同作業をやり易くします。一方で、GitHubはGitHub社が提供する世界有数のGitホスティングサービスで、有料の商用プランの他、無料でのリポジトリ環境が提供されている。今回は、GitやGitHubのサービスを利用する上での最低限の知識をまとめてみます。今回は個人でGitとGitHubを使う場合に役立つコマンドを中心にまとめました。
環境構築

GitHubへのSSHキー設定メモ(Windows用)

GitHubのリモートリポジトリへの接続などで必要なSSHキーの設定方法のメモを記します。
スポンサーリンク