技術コラム

【第1回】Lookerとは?概要や特徴をわかりやすく解説

ビジネスの成長は、データの利活用がキーポイントです。膨大なデータを収集・分析し、そこから現状の課題をいかに早く正確に見つけ出して、最適な意思決定を導けるか。ー その実現に大きな力を発揮するツールがLookerです。
今回は弊社エンジニアから見たLookerの魅力をご紹介します。

*****

Lookerは、データの探索と発見のビジネスインテリジェンスプラットフォームです。 これは、カリフォルニア州サンタクルーズに本社を置くアメリカのコンピューターソフトウェア会社であるLooker Data Sciences、Incによって最初に開発されました。 2019年、LookerはGoogleに買収され、現在はGoogle Cloud Platformの一部となっています。

Lookerは、基盤となるデータの視覚化の作成、定期的なレポートの生成、分析などの基本的なビジネス分析機能に加えて、Amazon Redshift、Google BigQuery、Teradataなどの拡張性や大規模な並列処理のあるリレーショナルデータベース管理システム向けに構築されています。

Lookerの利点の1つは、その柔軟性と汎用性です。 Lookerは、データエンジニアの役割とデータユーザーの役割を明確に分離します。 データエンジニアは、Lookerで定義された言語LookMLを使用して、データを前処理および準備してから、ビジネスアナリスト、マーケター、マネージャーなどのデータユーザーに渡すことができます。 他のBIプラットフォームは、データを抽出して前処理するためのツールとして、統合されたSQL拡張機能を提供します。 SQLは、リレーショナルデータベースのデータをクエリするために使用される一般的な言語ですが、使用するのは困難です。 基盤となるデータベースから有用なレポートを作成するには、通常、データエンジニアは複雑なクエリを記述して必要なデータを抽出する必要があります。

図1.SQLを使用したデータのピボット

さらに、SQLの使用は保守が難しく、再利用性が低くなります。 特に、複雑なクエリでは、コードを書いた開発者でさえ、それらのクエリの意味と目的を思い出すのが難しい場合があります。 データエンジニアが仕事を辞めたり、別の部署に異動したりして、他のスタッフに保守作業を移す場合に問題があります。

図2.非常に長く複雑になる可能性があるクエリ

Lookerは、columns (dimensions) 、 measures、 views (explores)などのデータベースの要素の明示的な意味のある定義を許可することにより、独自に定義された言語LookMLを使用してリレーショナルデータベースからデータをクエリするためのより良い方法を提供します。 基盤となるデータベースに関する特定の知識を持たないワーカーでも、LookMLを使用して作成されたジョブの意味を理解できます。 また、開発者はこれらの定義を再利用して、新しいタスクをすばやく作成できます。

さらに、Lookerは、プログラミングを知らないユーザーにも簡単に使用できるインターフェイスを提供します。 Lookerでのレポート(Look)とダッシュボードの生成はシンプルで、テンプレートが豊富です。 ユーザーは、データフィールドをドラッグアンドドロップし、視覚化のタイプ(マップ、棒グラフ、表、数値、テキストなど)を選択するだけで、データエンジニアが提供するデータに対して優れた視覚化と分析を簡単に作成できます。 以下は、Lookerで作成されたダッシュボードの例です。

図3.Lookerを使用して生成されたダッシュボード

Lookerは、Google Cloud PlatformまたはAWS内にデプロイでき、さまざまなクラウドサービスに接続できます。 Lookerは、お客様のオンプレミスサーバー内にインストールすることもできます。 ただし、オンプレミスのハードウェアは、LookerをインストールできるようにするためにJava SDKを備えたLinuxサーバーなどのいくつかの要件を満たす必要があります。 これらの要件の詳細は、Lookerの公式ウェブサイトで確認できます。 一般的に、Lookerのアーキテクチャは図4に示されています。

図4.Lookerのアーキテクチャ

Lookerをインストールしたら、次のステップは、Lookerをデータを保存する場所に接続することです。 Lookerは、Amazon redshift、Google BigQuery、その他の一般的なタイプのデータストレージ/データベースを含むさまざまなデータベース接続をサポートしています。 設定が完了すると、データの専門家はLookerで作業を開始できます。 Looker内でジョブを整理する1つの方法は、プロジェクト(LookMLプロジェクト)内です。 各プロジェクトには、データ、モデル、レイヤーが含まれています。 各プロジェクト内に保存されている情報は、バージョン管理(Git)で管理されます。 LookMLプロジェクト内で、開発者はdimension、measuresを定義し、viewを作成および探索できます。

図5.ビジネスデータを分析するためにLookerを使用

データエンジニアによって作成されたアーティファクトに基づいて、基盤となるデータベースまたはSQLについての知識がないユーザーは、提供されたデータを簡単に分析できます。 Lookerで最も一般的なタスクの1つは、レポート(Look)とダッシュボードの作成です。 Lookerは、再利用できるさまざまなレポートおよびダッシュボードテンプレートを提供します。 レポートとダッシュボードはスタッフ間で共有できるため、共同作業が容易になります。 レポートとダッシュボードに関する情報は、フィルターを使用して動的に更新および変更できます。

記事を締めくくるために、Lookerとその競合ソリューションの簡単な比較を提供したいと思います。 分析プラットフォームのオプションはLookerだけではありません。 分析プラットフォームは広く使用されているテクノロジーであり、多くの人々が予測分析、データ検出、および検索を備えた信頼性の高い洗練されたソフトウェアソリューションを求めています。 Looker以外のいくつかの競合オプションは、Microsoft Power BI、Tableau、およびQlikが挙げられます。 次の表は、これらのBIツールの違いを示しています。

図6.Lookerを他のオプションで比較

Lookerにもいくつかの制限があります。 高価なBIツールであることに加えて、Lookerはモデリング言語LookMLを使用するため、高い学習曲線が必要です。 データセットの設定と生成、およびメンテナンスとトラブルシューティングの実行については、ITチームに依存する必要があります。 さらに、データエキスパートを対象とした複雑なデータモデリング機能に重点を置いており、ビジネスユーザー向けの直感的なデータ探索にはあまり重点を置いていません。

参考: 1. https://data-viz-lab.com/bitool-comparison
   2. https://www.looker.com
   3. https://en.wikipedia.org/wiki/Looker_(company)

Related post

TOP