データサイエンス

金融 x データサイエンス実践

【シリーズ第1回】実践的セグメンテーション序論:なぜ「次元削減×クラスタリング」のアプローチが必須なのか

なぜ顧客セグメンテーションは失敗するのか?高次元データに直接k-meansを適用するだけでは「使える」インサイトは得られません。本稿は、次元削減とクラスタリングを組み合わせる戦略的アプローチの必要性を説く、実践的シリーズの第1回です。
キャリア・学習法

【超おすすめ】Googleの機械学習コースが、データ分析に関わる全ての人のバイブルだった

Googleが無料で提供する機械学習コースの決定版レビュー。MLの基礎から実務的な問題解決まで、豊富な図解と事例で驚くほど分かりやすく学べます。データ分析の初心者や、分析結果の社内説明に悩む実務者におすすめの理由を解説。
データサイエンス基礎

【金融データ分析】A/Bテストなしの効果検証|過去比較で失敗しない代替戦略

金融業界でA/Bテストが困難な状況でも、施策効果を正確に測定する方法を解説。過去比較の課題を克服し、妥当性と説得力のあるデータ分析報告を行うための3つの代替戦略を、具体事例を交えて紹介します。
AI・機械学習

【第3回/全3回】Stremlitを用いた簡易AutoMLツール開発 〜LightGBMによるモデル構築と評価〜

Streamlit最終回は、LightGBMを使った簡易AutoMLツール開発。CSVから分類モデルを自動で学習・評価する方法をコード付きで解説します。
AI・機械学習

【第2回/全3回】Streamlitで簡易データ分析ツールを作ろう 〜CSV読み込みからグラフ作成まで〜

Streamlit実践編として、簡易データ分析ツールを作成。CSVのアップロード、データ概要表示、利用者が列を選んでヒストグラム等のグラフを動的に作る方法をコードを交えて解説します。
AI・機械学習

【第1回/全3回】Streamlit超入門 〜概要と基本的なコンポーネントの使用法 (Google Colab編)〜

PythonだけでWebアプリが作れるStreamlitの基本操作をGoogle Colabで紹介。テキストやグラフの表示から分析ツール作成まで、コード付きで分かりやすく解説する入門ガイド。
AI・機械学習

【サンプルコードあり】ナレッジ管理に使える類似度検索(TF-IDF)

TF-IDFとコサイン類似度を組み合わせた問い合わせナレッジの類似検索プログラムを、Colabのサンプルコード付きで詳解。FAQ管理の精度と効率を同時に向上させます。
AI・機械学習

【最終章】モデルレビューの完成形とは?構造化・再現性・MLOpsで“使えるAI”をつくる方法

はじめに:現場で使われる機械学習モデルとは「モデルの精度が出たから、もう完成!」そう思ったあなた、ちょっと待ってください。現場で成果を出し続けるには、モデル単体ではなく“プロセス全体”をレビューする仕組みが不可欠です。本記事では、PoC段階...
AI・機械学習

【タイプ別】モデルレビューの進め方 分類・回帰・時系列で異なる“見るべきポイント”とは?

はじめに:”とりあえず精度”になっていませんかモデルレビュー、どう進めていますか?「とりあえず精度を見て終わり」になっているとしたら要注意です。分類・回帰・時系列モデルでは、それぞれ前提も評価指標も異なります。この記事では、モデルタイプ別に...
AI・機械学習

【初心者でも失敗しない】モデルレビューの基本:データ設計と検証分割を見直そう

はじめに:頑張って作ったのに使われないモデル「モデル精度は高いはずなのに、なぜか現場でうまく使えない……」そんな違和感を抱いたことはありませんか?実はその多くは、データ設計や検証方法の設計ミスに起因します。本記事では、モデルレビューの第一歩...