データパイプラインの構築と活用: データ分析プロセスとツールについて解説
データパイプラインの基礎からビジネス応用までを解説します。データレイク・データウェアハウス・データマートの違いや、分析プロセス、品質管理、ガバナンスについて、ビジネスにおける効率的なデータ活用のための総合ガイド。
Gemini APIとstreamlitで英会話アプリを作ってみた
Gemini APIとStreamlitを組み合わせて個人開発した英会話アプリを紹介。LLMのAPIの使用方法や、Pythonで簡単にアプリ開発できるStreamlitについても紹介します。
LangChainのOutput Parserの使い方
LangChain Output ParserでLLMの出力をpythonの構造化データに変換する方法を解説。Pydantic Parser を使用しGeminiの出力をJSONに変換するコード例も紹介。
【5分でわかる】DatabricksでHello Worldするまで
Databricks は、Spark ベースのデータ分析プラットフォームです。本記事ではDatabricksの初心者に向けて、Databricks の概要、コミュニティエディションの登録方法、ノートブックの作成方法、クラスターやワークスペースの確認方法、Hello Worldするまでの手順をご紹介します。
データサイエンティストとして働くのに必要なスキル
現在データサイエンティストとして2年ほどコンサルファームで働いています。
今回は私がこの2年間で学んだ「データサイエンティストに必要なスキル」について、自分なりの答えを話していきたいと思います。
これからデータサイエンティストや...