データクレンジングの履歴
●自己流の方法
◎一般的な方法(出典:ディジタルグロースアカデミア)
準備
◎遠し番号をつける
●テーブルを構成する
●ゆらぎが生じている列のスライサを表示し、ゆらぎや欠損値、エラー値を見つける
◎分析対象の行を抽出する:「有効」列を追加し、分析対象行に1を入力
文字列の表記をゆれ
◎文字列の始めまたは終わりの空白を除去:=trim()
●商号を統一(株式会社、(株)、㈱など)
●姓名は分離する。
変換して統一する
◎ひらがな・漢字をカタカナに変換:=phonetic()
◎英字を大文字に統一する:=upper()
◎英字を小文字に統一する:=lower()
◎英数字を全角に統一する:=jis()
◎英数字を半角に統一する:=asc()
検索・置換
●iferror(vlookup(対象,置換テーブル,置換列),"N/A")
年月日の変形
●年、月、日を抽出する:=year(), =month(), =day()
●yyyy/mm/ddをyymmに変換する:=(year(対象)-2000)*100+month(対象)
●曜日を抽出する:=text(対象,"aaa")、または、=text(対象,"aaaa")