どうもこんにちは、あんどう(@t_andou)です。 今回はChatGPTのAPIを使って遊んでみたのでメモをしておきます。
背景
ChatGPTに生成させる際にフォーマットを指定する事で構造化データ(CSVやDBなど特定のフォーマットに則ったデータ)が作れそうだと考えました。
ChatGPTは2021年までの情報しか学習させていない上に正確性に欠けるため、ダミーデータを作ることなどが適切な使用法だとは思うものの、移り変わりの少なそうな観光地情報などであればある程度実用に耐えられるかも?そこも実験してみようと判断し、全国の観光情報DBを作ってみることにしました。
やったこと
- ChatGPT APIを使って全都道府県のアクティビティ・観光情報(18493件)を集め(生成し)DBを作った
- 表示するwebアプリを作った
作ったもの
【ChatGPTの実験 : DBを作る】
— あんどう@AI開発者 (@t_andou) 2023年3月7日
ChatGPTで生成するフォーマットを固定する事でDBが作れそうだと思い、やってみました。https://t.co/JTaKBhSZzP
都道府県を選択するとおすすめの観光地やアクティビティが表示されます。
DBにしてるので当然ですが、ChatGPTのAPIよりも
・レスポンスが早い… https://t.co/Qu7CNBwBIj pic.twitter.com/2dEO841SKS
URL
使い方
都道府県を選択するとおすすめのアクティビティや観光地がランダムに最大9件くらい表示されます。
各アクティビティには名称、詳細、所要時間やコスト、難易度、対象年齢などの情報を載せてます。
今後の予定
モチベーション次第ですが、予算や滞在時間を選択するとおすすめのプラン(移動時間や営業時間は無視)を組み立てるところまで出来そうだしやりたい
やってみてわかったこと
- 決まったフォーマットでと指定しているにも関わらず、ChatGPTがたまに我に返って変な前置きをしたりするので、そういう時はエラーが出るが素直にやり直すのが吉(例外処理を詳細に書くよりコストが安いと判断)
- ChatGPTはDB作成にも使えた
- 全都道府県18493件のデータを集めたが、かかったコストは12ドルくらい
- アクセスを分散すればもっと早く終わると思うが1日くらいかかった
当然だけどDBにする事で下記も見込める - レスポンス速度の向上 - レスポンス長の制限無し - 1呼び出しあたりのコストが激安になる
まとめ
正確性は未検証なものの、飲食店のおすすめよりもちゃんとしたデータが出てきてそう。 この規模のデータベースを1日でしかも12ドルで作れるのはなかなか良い感じ。
プロフィールなどのデータ作成は向いているので、↓こういうこともやりたい。
画像生成AIと文章生成AIを使って
— あんどう@AI開発者 (@t_andou) 2023年3月6日
「自分以外全てAIのマッチングアプリ」を作ったら面白そう
大規模かつ攻略方法が公開されてない恋愛シミュレーションゲームみたいな感じ
プロフィール画像は全てStableDiffusion、プロフィール文や返信の文章はChatGPTで生成… https://t.co/PjQyenz3Cq
もっと詳しい作り方を知りたいという方は僕と友達になってください。
あんどう@AI開発者 (@t_andou) / Twitter
それでは。