データスタジオに最適なスプレッドシートのフォーマット作成術

spreadsheet-format

SPONSORED LINK

こんにちは、データアナリストのたぬ(@KAivlys)です!

前回、データスタジオにスプレッドシートをデータソースとして接続する方法を紹介しました。

【データの可視化】データスタジオにスプレッドシートを連携!自動レポート作成術

2018.09.05

しかし、ただ闇雲にスプレッドシートを繋げても、目的のデータがグラフ化出来ないのであれば何も意味がありません。

データスタジオでスプレッドシートのデータをちゃんと可視化させるためには、ちょっとしたコツが必要になってくるんですよね。

たぬ
僕自身、目的のデータを全然ビジュアライズ化できなくて結構ハマったポイントです…。

データスタジオは無料で使える素晴らしいBIツールなので、こんな単純なところで挫折してほしくない。そんな想いを込めて、この記事を書くに至りました。

それでは、データスタジオのデータソースとして最適なスプレッドシートのフォーマットの作成方法について紹介します!

表の形式

表を作成する上の5つの注意点

5つの注意点
  1. セルにはデータ(数値、文字列、日付)のみ格納する
  2. データはA1セルから入力する
  3. 列内のセルは、すべて同じタイプである必要がある
  4. セルの結合はしない
  5. 最初の行は、ヘッダー名を記述する

1.セルにはデータ(数値、文字列、日付)のみ格納する

データソースとして、グラフや画像、スパークラインを読み込むことは出来ません。

ワークシートの中身は表だけの状態にして、データスタジオに取り込ませましょう。

2.データはA1セルから入力

データはA1セルから入力します。行や列を余計に空けないでください。

スプレッドシートを他人に共有する場合、見やすさを考慮してA列の幅を調整して余白をあえて作っていますが、これはデータソースとしてはあまり適さないやり方です。

スプレッドシートをデータスタジオのデータソースとして作成する場合は、A1セルから入力してください。

3.列内のセルは、すべて同じタイプである必要がある

数値が格納されている列には、すべて数値を格納しなければいけません。

途中で別のデータ(文字列、日付)が混ざるとデータが正しく表示されないことがあります。

4.セルの結合はしない

各列には単一のセルだけが含まれるようにします。セルを結合すると、データが正しく表示されないことがあります。

そもそも、このブログでは『セルの結合は、絶対悪』と伝えまくっているので、いい加減セルの結合はしないでください。

5.最初の行は、ヘッダー名を記述する

データの最初の行には、ヘッダー名を記述します。これらはデータソースのフィールド名になります。

日付の形式

データソースとして取り込ませるスプレッドシートの日付データは、完全な年月日が含まれるようにします。(例: YYYYMMDD)

時間データがある場合は、日付フィールドと組み合わせます(YYYYMMDD[HH:MM:SS])。

セルの表示形式がテキストになっている場合は、表示形式を日付にしておきましょう。

手順
スプレッドシートの[表示形式] > [数字] > [日付]
パッと見て日付の表示形式がどちらになっているか確認する方法

  • セルのデータが左寄せ:テキストの可能性が高い
  • セルのデータが右寄せ:日付の可能性が高い

データ構造

いまから紹介する『データ構造』は、この記事の中で一番大事なポイントなので、しっかり押さえてください!!

横長の表より縦長の表を作る

データスタジオ用のスプレッドシートは、幅が広い表より縦に長い表にします。

縦長の表の作り方
可能な値ごとに列を作成するのではなく、データをカテゴリ毎にグループ化して、ディメンションの数を制限させる。

例として、商品の販売数をデータスタジオ用に作ってみました。

spreadsheet-format1

上:縦長の表、下:横長の表
横長の表を作ってしまったときのデメリット
  • 販売数の合計に対して、各商品ごとの割合を算出した円グラフが作成できない
  • 1つのディメンションごとにスプレッドシート側でワークシートを作成しないといけないので、管理が大変
  • データスタジオ側でフィルタの適用が難しい。商品の種類別にフィルタを適用することは出来ない

横長の表はデメリットだらけなので、縦長の表作成を心掛けてください。

集計の行は作らない

次のような合計や平均値、中央値などの行は作成しないでください。

データスタジオ側の集計で、ミスが発生してしまいます。

spreadsheet-format2

スコアカードの計算は失敗している例

この場合、スプレッドシートの合計の行まで計算されているので、誤った数字がデータスタジオのスコアカードに表示されてしまっています。

表の集計は、データスタジオにやらせたほうが無難です。誤って集計しないようにしましょう。

一度繋げたデータソースに列の追加、削除はしない

最後の注意点は、一度データスタジオに繋げたスプレッドシートの列は変更しないようにしてください。

シートの末尾(右端)への列の追加と、末尾の列の削除は可能ですが、列の順序変更や途中挿入、末尾以外の列の削除は現在サポートされていません。

これらを行うとデータ品質に悪影響が及ぶことがあるので、注意が必要です。

列の順序を変更する必要がある場合は、新しいデータソースを作成して、データスタジオに再接続しなおすことを推奨します。

まとめ

今回は、データスタジオにスプレッドシートを繋げる上で欠かせない、フォーマットの作成の方法を紹介しました。

データスタジオに最適なスプレッドシートのフォーマットまとめ
  • 表の形式
    1. セルにはデータ(数値、文字列、日付)のみ格納する
    2. データはA1セルから入力する
    3. 列内のセルは、すべて同じタイプに統一する
    4. セルの結合はしない
    5. 最初の行は、ヘッダー名を記述する
  • 日付の形式
    1. 完全な年月日(YYYYMMDD)が含まれるようにする
    2. 表示形式を日付にする
  • データ構造
    1. 横長の表より縦長の表を作る
    2. 集計の行は作らない
  • 一度繋げたデータソースに列の追加、削除はしない

以上のことを踏まえて、これからもレポートの自動作成をお楽しみください( ˘ ω ˘ )

それでは。

SPONSORED LINK

spreadsheet-format

ABOUTこの記事を書いてる人

たぬ(谷口健太)

25歳社会人。本職は福岡の通販会社でWebマーケッターやっとります。 プログラミング✕マーケティング=最強説を唱えており、非効率的な世の中に革命を起こそうと本ブログを設立。 ストレングスファインダー:戦略性・最上志向・目標志向・未来志向・個別化

NEW POSTこのブログの最新記事