SD/T

  • 【回帰分析の数理】#6 一般化線形モデル(GLM)とは

    はじめに 前回の記事では、線形回帰に続き、ロジスティック回帰を見ていきました。 目的変数である\(y\)は、線形回帰においては任意の実数値、ロジスティック回帰においては2値をとりました。では、目的変数\(y\)が、例えば...
    SD/T
    Written by
    SD/T
  • 【回帰分析の数理】#5 ロジスティック回帰の導出

    はじめに 前回までの記事では、データマイニングや機械学習において最もシンプルな手法である線形回帰の数理的な側面について見てきました。 今回は、2値分類を通じて、ラベル予測やリスクファクターの評価など様々な場面で使うことが...
    SD/T
    Written by
    SD/T
  • 【回帰分析の数理】#4 過学習を防ぐL2正則化とベイズ的解釈(MAP推定)

    はじめに データマイニング・機械学習における最もシンプルな手法である線形回帰を例に、今回の記事では過学習を防ぐテクニックの一つであるL2正則化と、L2正則化のベイズ的解釈について見ていきます。前回の記事では、説明変数の多い柔軟なモデル...
    SD/T
    Written by
    SD/T
  • 【回帰分析の数理】#3 線形回帰の多項式回帰への拡張

    はじめに データマイニング・機械学習における最もシンプルな分析手法である線形回帰について説明します。前回の記事では、説明変数が一つである単回帰分析から、説明変数が複数である重回帰分析への拡張を行いました。 今回の記事では...
    SD/T
    Written by
    SD/T
  • 【回帰分析の数理】#2 線形回帰のパラメタを決定する正規方程式

    はじめに データマイニング・機械学習における最もシンプルな分析手法である線形回帰について説明します。前回の記事では、線形回帰のうち説明変数が1つの場合である単回帰分析を例に、尤度関数について説明しました。 今回の記事では...
    SD/T
    Written by
    SD/T
  • 【回帰分析の数理】#1 線形回帰で学ぶ最尤推定

    はじめに データマイニング・機械学習における最もシンプルな分析手法である線形回帰について説明します。この記事では線形回帰を例に、データマイニングの基礎概念である尤度関数について学びます。データマイニングとは、データから意思決定を高度化...
    SD/T
    Written by
    SD/T
  • 機械学習とデータマイニングの違い

    SEEDATA Technologiesは、統計学や情報科学を用いてインサイト開発を支援するチームです。この記事では、データ分析で用いられる、機械学習・データマイニングという混同されがちな2つの用語の位置づけを整理します。 機械学習(...
    SD/T
    Written by
    SD/T
  • トピックモデル:最適なトピック数

    トピックモデルは複数の文書データに共通のトピック群を探す手法で、文章の中で言語的に固定された単語や意味カテゴリではなく、複数の単語の共起性によって創発される潜在的意味を抽出してくれます。 前回までは、トピックモデルにおけるハイパーパラメタ...
    SD/T
    Written by
    SD/T
  • トピックモデル:文書データの粗視化とハイパーパラメタの概念的意味

    トピックモデルは複数の文書データに共通のトピック群を探す手法で、文章の中で言語的に固定された単語や意味カテゴリではなく、複数の単語の共起性によって創発される潜在的意味を抽出してくれます。今回は、トピックモデルの入力となる文書データが粗視化さ...
    SD/T
    Written by
    SD/T
  • トピックモデル:最適なハイパーパラメタとは?

     トピックモデルは複数の文書データに共通のトピック群を探す手法で、文章の中で言語的に固定された単語や意味カテゴリではなく、複数の単語の共起性によって創発される潜在的意味を抽出してくれます。このページではSEEDATA Technologie...
    SD/T
    Written by
    SD/T