この記事では、Gemini APIとpython、streamlitを用いて作った英会話アプリを紹介します。
あくまで自分用のアプリですが、streamlitを使うと簡単に綺麗なアプリが作れたのでシェアしたいと思います。
主な機能
元々は自分が英会話の練習をしようと思ったのがきっかけです。ただいきなり人と話すのはハードルが高いので、エンジニアリングの練習がてらAI相手の英会話練習アプリを作ろうと考えました。
アプリの主な機能は以下。
今回実装した機能
- 音声認識:マイクから拾った音声を認識して入力 (文字入力も可能)
- AIによる返答:自分の話した内容に応じてAIが返答
- AIのアドバイス:同時に自分の話した英語が自然な表現かどうか評価
使用技術
- Gemini API
- streamlit
- Speech Recognition
Gemini AI とは
Gemini AIは、2023年に Google AI が発表したLLMです。従来のLLMと比べて、流暢な文章生成や多言語対応といった特徴を持ち、対話型AIに最適なモデルとして注目されています。
streamlitとは
streamlitは、Pythonで簡単にWebアプリを作成できるライブラリです。従来のWebアプリ開発とは異なり、HTMLやCSSなどのフロントエンドの知識がなくても、コードを書くだけで見栄えの良いアプリを開発できます。
streamlitの主な特徴
- コード量が少なくて済む
- 直感的な操作でアプリ開発ができる
- リアルタイムでアプリのプレビューを確認できる
- 豊富なウィジェットが用意されている
- 無料で利用できる
参考資料
実装部分(執筆中)
(また後日…。)
ほとんどこちらの記事を参考に作成しました。
- 【開発】StreamlitでGeminiを使用したアバター音声対話&VQAアプリ作ってみた:https://qiita.com/Yuhei0531/items/db894a8fba9c671eb7b0
使ってみた
自分がマイクに向かって話した英語を読み取り、それに対する返答をGeminiくんが返してくれました。
さらに右側には自分の英語に対する評価を書いてくれてます。勉強になりますね。
感想
アバターも作って音声回答してくれるともっと対話性が増す気がします。
あとはもっと学習効率を上げたいですね。単語やイディオムを記録して復習できるようにしたりとか。
まとめ
Gemini AIは、手軽に使えて高性能なLLMだと思います。今回開発したアプリはあくまでも個人的なものですが、APIを利用してAIを組み込んだアプリを簡単に作ることができました。
streamlitはそういった「ちょっと試してみる」程度の開発にはぴったりで、なおかつクオリティの高い仕上がりを実現できます。ぜひお試しください。
さらに学びたい方へ
Udemyの以下の動画が参考になりますので、ぜひこちらもご覧ください。
(Udemy動画は結構高いものもありますが、セールで80%OFFになったりもするので、セールのタイミングで一気に購入してしまうのがおすすめです)
コメント