クラウド

【初心者向け】BigQueryにPower BI Desktopで接続・データ分析

*記事内に商品プロモーションを含む場合があります

無料のPower BI Desktopを使って、BigQueryのデータにアクセスし、Power BIで分析するための基本操作を紹介します。

接続方法、データ登録方法、データ参照方法などの基本を初心者も理解できるように画像を多めに説明しています。

Power BI Desktopのインストール

Power BIは、Windowsの開発元のマイクロソフトのツールなのでマイクロソフトの公式サイトからダウンロードします。無料で使用可能です。

Microsoft Power BI ダウンロード(公式)

「Microsoft Power BI Desktop」の「ダウンロード」をクリックします。

「Microsoft Store」が表示され、ダウンロードします。
以下の画面は筆者が、Power BI Desktopをインストール済みなので、ボタン「開く」になっています。

Power BI Desktop で BigQueryに接続

Power BI Desktopを起動します。「Power BI Desktop」という名前で登録されます。

「データを取得」をクリック。

「データベース」-「Google BigQuery」を選択し、「接続」ボタンをします。

以下のダイアログが表示されますが、「OK」で進みます。
(詳細設定オプションの設定は不要です。)

BigQuery(Googleのサービス)を使用するために、Googleにサインインする必要があります。
「サインイン」ボタンをクリックします。

ブラウザーが起動され、Googleへのサインインが求められます。

接続するGoogleアカウントを選択します。
BiqQueryが使えるGoogleアカウントを選択します。

Power BIからのアクセスの許可が求められますので、「許可」ボタンを押します。

ブラウザーの画面に「サインインが完了しました。アプリケーションに戻ることができます。このブラウザーのタブを閉じてください。」と表示されるので、ブラウザーのタブを閉じます。

サインインした状態に変わったら、「接続」ボタンを押します。

Power BIのナビゲーター画面にデータセットが表示され、登録済みのテーブルにアクセスできるようになりました。

誰でも利用可能な一般公開データセットという各分野のデータがBigQueryに保存されていて検索を実行できます。(bigquery-public-data)

テーブル名をクリックし、「読み込み」ボタンを押すと、Power BIでデータ分析が可能になります。

BigQueryにデータ登録(CSVファイル)

自分で作成したデータを登録したい場合に、いつくか登録方法があります。
今回は一番簡単なCSVファイルを登録する方法を紹介します。

デ―タセットを作成

プロジェクトの「:」ボタンをクリックし、「デ―タセットを作成」を選択します。

データセット名(データセットID)を入力し、「デ―タのロケーション」を選択します。

デ―タのロケーションは、データを保存する地域のことですが、クラウドでは取り出し時に転送データに応じて課金されるケースが多いので、データ登録の場所とアクセス元(検索元)は費用節約の面で合わせておいた方がいいです。

テーブルを作成

データセットを作成した後は、データセットにテーブルを作成します。
データセットの「:」ボタンをクリックし、「テーブルを作成」を選択します。

CSVファイルをアップロード

CSVファイルをアップロードします。

テーブルの作成元:アップロード
ファイルを選択 :[参照]ボタンをクリックし、Windowsの存在するCSVファイルを選択
テーブル : テーブル名を入力
スキーマ「自動検出」をチェック。(手動は面倒なので)

古いデータですが、以下のCSVファイルをダウンロードして、BigQueryに登録しました。
(地域コードが入っているデータで、地図にマッピングしたかったので。)
COVID-19データ:Download today’s data on the geographic distribution of COVID-19 cases worldwide

Power BI でデータ分析

BiqQueryに接続すると先ほど登録したテーブルが確認できます。

テーブルをチェックすると右側にデータの一部が表示されます。

「読み込み」ボタンを押すとデータの取得方法の画面が表示されます。

データサイズが大きくなければ、”インポート”で問題ありません。

インポート
選択されたテーブルと列は Power BI Desktop にインポートされます。
操作するときPower BI Desktop はインポートされたデータを使用します。
インポートした後にBigQuery上で更新されても反映されません。

DirectQuery
Power BI Desktop にデータがインポートされません。
操作するときに、Power BI Desktop で基になるデータ ソースに対してクエリが実行されるため、常に現在のデータが表示されます。

Power BI Desktop の DirectQuery(マイクロソフト公式)

「OK」ボタンを押すとデータがインポートされ、Power BIに表示されます。

今回の使用例は、COVIDの国別の死亡者数を表示させてみます。

地球後アイコンのマップを選択。

右の”フィールド”の countryterritoryCode と deaths をチェックします。

「ファイル」「オプションと設定」「オプション」「グローバル」「セキュリティ」の「地図と振り分け地図の画像を使用する」にチェックが必要です。

反映されるのは、次回の起動時のようなので、Power BIを一旦終了して、再起動します。

こんな感じで、地図の上の数に応じたサイズのマルが表示できました。

あとは、Power BIでいろいろな観点でグラフを変えたり、条件でフィルタしたりいろいろPower BIの機能を試せます。

その他(リソース使用量)

結構、メモリを使います。

この一連の操作で、メモリを合計 1.2GB を使っています。
古いPCやメモリが少ないPCでは処理が重たいかもしれません。

最後に

Power BI DesktopでBigQueryに接続して、データを表示させてみました。
Power BI DesktopとBigQuery 両方にいろいろ可能性を感じますね。

BigQuery 検索スピードを体感
【BigQuery入門】BigQueryの使い方!一般公開データで数億件規模で検索スピードを体感BigQueryはブラウザからの操作でテラバイト(TB)、ペタバイト(PB)のデータに対し、SQLを実行できます。 この記事では、...
BigQuery 無料
【BigQuery入門】Google BigQueryを無料枠での利用方法BigQueryは、ペタバイト規模のデータに対する分析を可能にする、グーグルのクラウドサービスで利用できるフルマネージドのデータウェアハ...