データクレンジング

0pt

●自己流の方法
◎一般的な方法(出典:ディジタルグロースアカデミア)

準備

◎遠し番号をつける
●テーブルを構成する
●ゆらぎが生じている列のスライサを表示し、ゆらぎや欠損値、エラー値を見つける
◎分析対象の行を抽出する:「有効」列を追加し、分析対象行に1を入力

文字列の表記をゆれ

◎文字列の始めまたは終わりの空白を除去:=trim()
●商号を統一(株式会社、(株)、㈱など)
●姓名は分離する。

変換して統一する

◎ひらがな・漢字をカタカナに変換:=phonetic()
◎英字を大文字に統一する:=upper()
◎英字を小文字に統一する:=lower()
◎英数字を全角に統一する:=jis()
◎英数字を半角に統一する:=asc()

検索・置換

●iferror(vlookup(対象,置換テーブル,置換列),"N/A")

年月日の変形

●年、月、日を抽出する:=year(), =month(), =day()
●yyyy/mm/ddをyymmに変換する:=(year(対象)-2000)*100+month(対象)
●曜日を抽出する:=text(対象,"aaa")、または、=text(対象,"aaaa")

「データクレンジング」について友人に書いてもらう。

あなたにとって「データクレンジング」とは?

ログインするとワンクリックでキーワードを投稿できます

ログインする 新規登録する

他の人の「データクレンジング」を見る