【Gemini × 音声メモ x Python】録音内容を自動要約するデスクトップアプリを作ってみた第3回

第5章：アプリの動作確認
第6章：トークンの使用量

第5章：アプリの動作確認

起動確認

　前回までの章でコードの生成を行ってきました。
　実際に生成したコードを使用してアプリの動作確認を行っていきます。
　IDLEを起動してコードを実行した結果がこちらです。

API設定

　要件定義でも設定した通り、設定画面を作成しています。ここではAPI、モデル選択、マイク選択を設定することができます。
　要約機能を使用する場合には、この画面でAPIを入力しておく必要があります。以前の章で紹介した通りGeminiのAPIキーを入力してください。詳細はこちら

動作確認

主要な機能は意図通りできていそうですね(実際の一回目はバグがあり、ChatGPTに修正してもらいました。)。
録音開始を一度押すと、録音終了ボタンに切り替わり、その間話した内容を録音します。録音終了ボタンをクリックすると音声からメモを作成するといった感じになります。

・要約機能
要約ボタンをクリックすると左側の音声メモの内容を要約してくれます。
下図が実際の動作画面です。しっかりと要約してくれているのが見えますね。

・メモ保存機能
メモ保存、要約保存のボタンをクリックするとデータを保存してくれます。
これも意図通り動作していることが確認できました。

・ログの読み込み機能
これは保存された音声メモデータを読み込むことができる機能です。
再度要約を生成したい場合等に使用することができます。

第6章：トークンの使用量

今回のアプリでは無料枠のトークンを消費して要約を行います。
　日本語で500文字くらいの要約を依頼する場合、多く見積もって400トークンくらい、返信の分が半分の分量で返ってきたと想定すると200トークンくらい。一回の要約依頼で600トークンを消費すると想定すると無料枠で十分活用できそうですね。
　今回のアプリではGeminiを使用しましたが、ChatGPT版も簡単に作成可能です。私はChatGPTを有料で契約しているので、個人使用の範囲ではChatGPTを使用しています。有料のAPIを使用するとできることがかなり広がります。
　料金的にも0.14円/5oo文字くらいの価格なので、一つは契約して試してみることをお勧めいたします。

お問い合わせ・ご質問はこちらから

【Gemini × 音声メモ】録音内容を自動要約するPythonアプリを作ってみた第3回