RAG: コンセプトから Bedrock + OpenSearch Serverless での構築まで
Large Language Model (LLM) は驚くべき汎用性を持っていますが、次の二つのケースでは決まって失敗します。学習時に見ていない情報を尋ねられたとき、そしてその情報が学習期間の締め切り日 (cut-off date) 以降に変化したときです。 ファインチューニング、つまりモデルを自分のデータでさらに学習させて自分のドメインの詳細を吸収させる手法は、この二つの失敗に対する一つの答えです。ただし、コストが高く、反復が遅く、根底のデータが変わった瞬間に古くなります。多くのチームにとって本当に欲...
OpenSearchでサクサク検索してみよう
みなさん、OpenSearch使ってますか? 聞き慣れない方は、もしかしたらElasticSearchのほうが聞き慣れていたりしますでしょうか? OpenSearchは、Amazonが Elasticsearch のフォークを元に 2021 年に公開した検索エンジンで、Amazon OpenSearch Service はこれをマネージドサービスとして提供しています。 現在、AWS のマネージド検索サービスとしては OpenSearch のみが利用可能です。 今回は、このOpenSearchの説明および簡...
AWS Batchの活用
膨大な量のデータの時代に、バッチはアプリケーションと同じくらい、欠かせない処理です。 バッチを起動するためにはフレームワークを選びつつデプロイ先も思考する必要があります。 一般的と言えば Spring Batch, Kubernetes の Job や Cronjob、分散システムの場合 Hadoop、Apache Spark などの技術を使って Kubernetes 上デプロイの形です。 ただし、小規模のプロジェクトまたは単独のバッチだと上記の導入は困難です。 したがって以下の懸念点がありました: 導...



