ニートの言葉

元ニートがやってみたこと・その過程で学んだこと・考えたこと・技術メモあたりを主に書いています。情報革命が起きた後に訪れるであろう「一億総ニート時代」の生き方を考え中です。

ChatGPTの実験 : DBを作る

どうもこんにちは、あんどう(@t_andou)です。 今回はChatGPTのAPIを使って遊んでみたのでメモをしておきます。

背景

ChatGPTに生成させる際にフォーマットを指定する事で構造化データ(CSVやDBなど特定のフォーマットに則ったデータ)が作れそうだと考えました。

ChatGPTは2021年までの情報しか学習させていない上に正確性に欠けるため、ダミーデータを作ることなどが適切な使用法だとは思うものの、移り変わりの少なそうな観光地情報などであればある程度実用に耐えられるかも?そこも実験してみようと判断し、全国の観光情報DBを作ってみることにしました。

やったこと

  • ChatGPT APIを使って全都道府県のアクティビティ・観光情報(18493件)を集め(生成し)DBを作った
  • 表示するwebアプリを作った

作ったもの

URL

https://tabi-ai.web.app/

使い方

都道府県を選択するとおすすめのアクティビティや観光地がランダムに最大9件くらい表示されます。
各アクティビティには名称、詳細、所要時間やコスト、難易度、対象年齢などの情報を載せてます。

今後の予定

モチベーション次第ですが、予算や滞在時間を選択するとおすすめのプラン(移動時間や営業時間は無視)を組み立てるところまで出来そうだしやりたい

やってみてわかったこと

  • 決まったフォーマットでと指定しているにも関わらず、ChatGPTがたまに我に返って変な前置きをしたりするので、そういう時はエラーが出るが素直にやり直すのが吉(例外処理を詳細に書くよりコストが安いと判断)
  • ChatGPTはDB作成にも使えた
  • 全都道府県18493件のデータを集めたが、かかったコストは12ドルくらい
  • アクセスを分散すればもっと早く終わると思うが1日くらいかかった

当然だけどDBにする事で下記も見込める - レスポンス速度の向上 - レスポンス長の制限無し - 1呼び出しあたりのコストが激安になる

まとめ

正確性は未検証なものの、飲食店のおすすめよりもちゃんとしたデータが出てきてそう。 この規模のデータベースを1日でしかも12ドルで作れるのはなかなか良い感じ。

プロフィールなどのデータ作成は向いているので、↓こういうこともやりたい。

もっと詳しい作り方を知りたいという方は僕と友達になってください。

あんどう@AI開発者 (@t_andou) / Twitter

それでは。