Ollamaを使用してさまざまなLLMをローカルで実行する

で環境設定が完了します。

私はLlama3を実行してみました。実行中には多くのコンピュータリソースが使用され、他のアプリケーションが遅くなるものの、全体的な体験は良好でした。

Ollamaは複数の大型言語モデルをサポートしています（https://ollama.com/library）。

最新バージョンでは、Embedding models のサポートが追加され、Chroma DB 技術が使用されています。これにより、開発者は検索を活用した生成（RAG：Retrieval-Augmented Generation）のアプリケーションを構築でき、テキストプロンプトと既存のドキュメントやその他のデータを組み合わせてコンテンツを生成できます。以前紹介した Gaia も同様の機能を持っています。

具体的な手順は以下の通りです：

埋め込みベクトルを生成する
検索を行う
コンテンツを生成する