データをキレイにする技術

無料ツールOpen Refineを利用したデータクレンジングの実践をどなたにでも

データをキレイにする技術
データをキレイにする技術

データをキレイにする技術 free download

無料ツールOpen Refineを利用したデータクレンジングの実践をどなたにでも

【本コースは、どんな内容か】

・Open Refineというオープンソースで無料のウェブアプリケーションを使用して「データをキレイにする」ための方法論と具体的な手法をご紹介します。

・全般的にマウスでの操作になりますが、一部、スクリプトとよばれる一行単位で完結するような短めのプログラミング言語を使う場面もあります。

・データがキレイになった結果として、可視化や分析に用いるツールの幅を広げ、打ち手を増やしていくことが可能になります。

・「データをキレイにする」ことがテーマであり、データ取得やデータ可視化については扱っていません(話の流れで登場している箇所はあります)。それらについては今後別のコースとしてリリースしていきます。


【本コースの特徴】

・本コースでは、作業全体を、クレンジングと整形、列と行にわけ、この4マスに作業を分類し、具体的な作業内容について、共有しています。

・ほかの書籍やツールなどで紹介されているクレンジング方法は、抽出/集約/結合などといったデータベースの操作をベースとしているため、一般の方には少し分かりづらいかなと思います。

・無料のツールを用いて、データ活用の専門家でない、一般の方がどなたでもデータを活用いただけるような体系化を試みています。


【本コースの受講順序】

・A...セクション1〜3:原理原則の紹介

・B...セクション4〜10:ツール操作方法の紹介

・C...セクション11〜13:サンプルデータを用いた演習

・D...セクション14:まとめ

という構成になっております。


※すべての動画を最初から最後までこの順序で見なければならない、ということはありません。

たとえば、

・A→C→B(基礎と実践をできるだけ最短で)

・C→B→A(座学は後回しでいいので、まずはサンプルを言われたとおりに操作しながら慣れたい)

といった順序でご覧いただいてもいいでしょう。


【本コースで対象とするデータ】

・リスト形式の表データを対象にしています。

・複雑な階層のファイル、ネットワークデータ、自然言語の文章や画像/音声/動画ファイルといったメディアファイルは対象にしません。


【本コースで対象としていない処理】

・機械学習のための前処理は対象にしていません。

・データの匿名化は対象にしていません。