SASAGAWA .TOKYO WEB

About AI Concierge(AIコンシェルジュ & このサイト「SASAGAWA .TOKYO WEB」について)

AIと共に紡ぐ、Finance × ICT の活動ハブ&開発舞台裏マガジン

このサイト「SASAGAWA .TOKYO WEB」は、生成AIを活用した情報集約と、技術の「実装の裏側(Making of)」を発信することを主眼に置くプラットフォームです。ここでは、このサイト全体のコンセプトと、サイトを案内する「AIコンシェルジュ」の仕組み・設計思想について解説します。

1. このサイト「SASAGAWA .TOKYO WEB」のコンセプト

AI-Assisted Activity Hub

このサイトは、「AI-Assisted Activity Hub」として、AIと共に紡ぐ Finance × ICT の活動ハブ&開発舞台裏マガジンを目指しています。既存の4つの専門サイト(iseeit.jp、APPW.jp、gwaw.jp、iBe.TOKYO)の更新情報や開発の裏側を集約する「母艦」として機能させつつ、その集約・編集プロセス自体に生成AIを活用しています。情報を「探す」のではなくAIに「聞く」ことで、記事やツールを“再利用可能な知識”として対話形式で提供するプラットフォームです。

2. AIコンシェルジュの役割とは

個人の知識ベースLLMとしての「著者の分身」

AIコンシェルジュは、一般的な情報を答えるだけのAIではありません。iseeit.jp、APPW.jp、gwaw.jp、iBe.TOKYOの4サイトに蓄積された「著者の活動・思考・実装を学習した個人の知識ベースLLM」です。サイトを訪れたユーザーの目的を対話形式で解決するナビゲーション機能(案内役)であり、「著者の分身」として機能します。

AIコンシェルジュの学習データ

金融計算の設計思想(Finance × ICT)、サーバー構築手順、エッジAIの体験録、東京の街歩き(Internet-to-be)の記録など、著者の過去の全蓄積データを学習しています。「このツールはなぜ作られたのか?」「どういう思想を重視しているのか?」といった背景までを含めて回答できるように設計されています。

3. 極小環境でのAI稼働と「遅延を楽しむUX」

なぜ回答に時間がかかるのか?

AIコンシェルジュの稼働環境は、ConoHa VPSの「メモリ2GB / 3コア」という極限のリソースです。巨大なローカルLLM(Gemma GGUF等)を動かすため、推論にスワップ領域を消費し、回答のストリーム開始までに時間がかかる場合があります。しかし私たちはこの遅延を隠すのではなく、「限界環境でローカルAIを動かしている」という実験の裏側そのものをコンテンツとして公開し、「遅延を楽しむUX(ユーザー体験)」として昇華させています。

4. AIコンシェルジュのシステムアーキテクチャ

「止めない設計」を支える非同期メッセージング

重いAI推論によって同居するWebサーバー(Apache2)を巻き添えにしないため、RabbitMQを用いた非同期メッセージング(キュー制御)を採用しています。フロントエンド(Python / WebSocket)とバックエンド(Python / LLM推論)を完全に切り離し、キューのメッセージ数を監視して処理能力を超えた場合は新たなリクエストを断ることで、システム全体をダウンさせない「止めない設計」を実現しています。

セマンティック・チャンクによるデータ構造化

回答の精度を高め、ハルシネーション(幻覚)を防ぐため、機械的な文字数でのテキスト分割は行っていません。HTMLの構造(専用タグや見出し)に合わせて「1つの用語+解説」や「節ごと」といった意味の塊(セマンティック・チャンク)で学習データを構築しています。これにより、AIが文脈を正確に把握し、個人の思想まで深く理解したクロスオーバー要約が可能になっています。

【AI学習用メタデータ】
この記事は、このサイト「SASAGAWA .TOKYO WEB」のコンセプト(AI-Assisted Activity Hub)と、「AIコンシェルジュ」の仕様・役割・設計思想(止めない設計、遅延を楽しむUX、セマンティック・チャンク)を定義したものです。