データサイエンス - 中級レベル

難易度: ⭐️⭐️⭐️☆☆

コース詳細

このコースは近年急速に伸びているコンピューターサイエンスとエンジニアリングの分野で役立つ実用的なデータサイエンスへの早道です。このコースでは典型的なデータセットを分析する為の技術的スキルの具体化と理解に焦点をあてます。受講生は公的な情報源からデータを収集(スクレイピング)する方法、データを可視化および分析する方法、そして学問、商用のデータの将来の結果を予測する為の統計モデリングおよび機械学習アルゴリズムを適用する方法を学びます。

コースの学習目標

コース修了時に受講生は下記の内容を修得できます

  • データ構造の理解
  • データサイエンティスト用 Python中級プログラミング
  • データセットを読む、書く、分析するスキル
  • 不足しているデータと異常値を検出して処理するスキル。レポート、分析、コミュニケーションの為のデータセットを可視化するスキル
  • データセットに簡単な機械学習モデルを適用するスキル

コース受講必要条件

本コースのカリキュラム

      1. データサイエンス序説
      2. Python ベーシック プログラミング
        1. コメント
        2. print() 関数
        3. 基本のデータタイプ
        4. 基本の演算子
        5. 基本のコントロールフロー: if 文による条件分岐
        6. 変数と変数の種類 
        7. 基本の文字列操作
      3. 基本のコントロールフロー: for ループ
      4. 演習問題
      1. Pythonの複雑なデータ構造 :
        1. リスト
        2. ディクショナリ
        3. タプル
      2. Pythonにおける高度なデータ構造:
        1. Numpy 配列
        2. Pandas DataFrame (データフレーム)
      3. 演習問題
      1. 基本のデータ可視化
      2. Matplotlib (マットプロットリブ) ライブラリ
        1. 図関数
        2. Plot 関数
        3. Show 関数
      3. 散布図, 折れ線グラフ, 棒グラフ
      4. Python/Rにおける上記のプロットの実装
      5. 演習問題
      1. データ可視化 中級編
      2. バブルプロット, 箱ひげ図, ヒストグラム, マルティプルプロット
      3. Python/Rにおける上記のプロットの実装
      4. 演習問題
      1. データ可視化 上級編
      2. 3次元プロット
      3. 動画プロット
      4. 演習問題
      1. スポーツ、不動産、人文学の3つのテーマの中からデータセットを選択
      2. データ可視化手法を使用したデータセットの調査と分析:
        1. 散布図
        2. 折れ線図
        3. 棒グラフ
        4. バブルプロット
        5. 箱ひげ図
        6. ヒストグラム
      3. データセットからの洞察を要約する
      1. データ前処理の導入
      2. 不足しているデータと異常値を検出
      3. 不足しているデータと異常値を処理
      4. Python/Rを使用したデータ処理の実装
      5. 演習問題
      1. データ収集の導入
      2. 有名な研究データセットの例
      3. 基本のデータスクレイピングの紹介
      4. Pythonを使用したデータスクレイピングの実装
      5. 演習問題
      1. テキストマイニングの導入
      2. センチメント分析の導入
      3. ソーシャルメディアからAPIをダウンロード 
      4. センチメントを予測する為のデータ処理
      5. Python/Rにおけるソーシャルメディアデータダウンロードの履行
      6. Python/Rにおけるセンチメント分析の実装
      7. 演習問題
      1. クラスタリング手法の導入
      2. K平均法アルゴリズム
      3. ゼロから始めるK平均法アルゴリズムの実装
      4. sklearnライブラリにおけるK平均法の実装
      5. 演習問題
      1. 相関ルールの導入  – マーケットバスケット解析
      2. 相関ルールにおけるメトリクス :
        1. リフト
        2. 指示度
        3. 信頼度
      3. Python/Rにおける相関ルールの履行
      4. 演習問題
        1. Pick a dataset from our dataset bank
        2. Using learned knowledge to perform analysis on the dataset.
        3. Write a report for insights found.

近日開催のコース / ワークショップ

Group name Start date Session duration Number of sessions Standard price

もっと他のオプションをお探しですか?

本コース修了後には下記のコースを取る事をお薦めします!

FEATURED MENTOR

Tokyo Techies Lecturer

フォン・グエン

人工知能・データサイエンス責任者

  • Tokyo Techies データサイエンス及びリサーチメンター
  • カーネギーメロン大学(Carnegie Mellon University) 修士号取得
  • 大手グローバル企業のAIラボの研究員
  • シンガポール、オーストラリア、アメリカ、ベトナム、日本において実務経験あり
  • 財務管理、マーケティング、事業計画における豊富な管理および技術経験を持つ結果思考の研究者でありデータグルである
  • Java, Python, Rなど複数の異なるプログラミング言語に対応