​最終更新:2022/5/24

​ここでは色々な言葉を整理する。

 

LGWAN-ASP について

​・

 

◇データレイク

​・データレイクとは、データの解析や活用を行うために、形式や規模によらず雑多なデータを一元的に保管しておくためのデータ管理システム。これまでデータ解析のために管理されるデータの置き場としてデータウェアハウスなどが用いられてきたが、これは業務システムなどがリレーショナルデータベース(RDB)のテーブルなどの形で定型的に整然と記録した構造化データに限られる傾向があった。データレイクではこうしたデータ源だけに限らず、人間の作成した文書ファイル群や外部から収集したオープンデータ、Webサイトのログデータ、ソーシャルメディアの書き込み、IoTデバイスが記録したデータなど、様々な種類のデータを単一のシステムで管理する。事前に決められた特定の構造や形式へのデータの変換や整形は不要で、非構造化データもそのままの形で格納することができる。分析などで後で実際に読み出す際に必要な前処理が行われる(スキーマオンリード)。データの記録には安価なストレージ装置を用い、コストに縛られずにとにかく大量のデータを収集、保管することを主眼とする。集めたデータはビッグデータ解析システムや全文検索システム、機械学習システムなどを用いて事業や業務に有用な洞察や知見、予測などを得るために活用される。どんなデータも蓄積できるといっても、高度な活用のためにはどこに何がどのように記録されているかといったメタデータが適切に付与され、データカタログなどの形で整理されている必要がある。野放図にデータを記録した結果、データの意味や所在が不明になってしまった混沌とした状態は「データスワンプ」(swamp:沼)と呼ばれる。

 
 

■仮想化とは

【説明】※クラウドナビより

 仮想化とは、サーバーなどのハードウエアリソース(CPU、メモリ、ディスクなど)を抽象化し、物理的な制限にとらわれず、ソフトウエア的に統合・分割できるようにする技術。Virtualという英単語は、「仮想」と訳されるが、この単語はもともと「実質的に」や「事実上の」といった意味を持つ。つまり、「仮想化されたサーバー」は「偽物のサーバー」ではなく、「本物の(物理的な)サーバーではないが、ソフトウエアによって実質的に本物と同じように扱えるサーバー」と解釈するとわかりやすい。

 かつては、サーバーは用途ごとに専用のハードウエアを複数用意して構築したが、サーバーを仮想化することで、1台の物理サーバーの上に複数の仮想サーバーをソフトウエア的に作成し、同時に動かすことができる。

 サーバーの仮想化を行うには、専用の仮想化ソフトウエアが必要で、オラクルの「Virtualbox」、VMwareの「VMware vSphere®」、Microsoftの「Hyper-V」などが有名。また、サーバーだけでなく、ストレージやネットワーク、デスクトップ環境やアプリケーションといったリソースの仮想化も利用されています。

 メリットは、効率的なリソースの活用。サーバーのスペックはピーク時の負荷に耐えられる設計のため、ピーク時以外では必然的に余剰リソースが発生するが、ハードウエアの間を越えて、CPUやメモリなどのリソースを融通しあうことはできない。

 しかし、サーバーを仮想化すれば、複数の仮想サーバーを1台の物理サーバー上に集約できます。物理サーバーが持つリソースを複数の仮想サーバーに自由に配分できるため、リソースを効率的に使用できます。

 デメリットは、処理速度や応答速度などのパフォーマンスが物理サーバーを直接利用した場合に比べて、低下すること。クラウド環境であれば、オンデマンドにリソースを追加することで対応できます。しかし、オンプレミスに仮想化環境を構築している場合は、ホストマシンのリソースが枯渇してしまうと、それ以上仮想サーバーをスケールアップできなくなってしまいます。

仮想化は「技術」、クラウドは「サービス」
 前述の通り、仮想化とはハードウエアを抽象化し、リソースを効率よく利用できるようにするための技術のことです。対してクラウドとは、ネットワーク経由で利用することができるサービスの呼び名です。

 このように仮想化とクラウドは、そもそも指している対象がまったく異なる言葉です。しかし、「クラウド(IaaS)」は、サーバーやストレージといったITリソースを「仮想化」して管理・提供しているなど、仮想化とクラウドは非常に密接な関係にあります。 

​ 現在のソフトウエアの開発スピードは非常に高速化しています。従来のような「ハードウエアの調達に2週間」「セットアップに1週間」といったスピード感では、こうした高速な開発サイクルについて行くことができません。必要な時に必要なだけのITリソースを、迅速に確保できるクラウドが重宝される背景には、こういった理由が存在します。そして、クラウドがITリソースをネットワーク越しに迅速に提供できるのは、それらのリソースが仮想化されているからにほかなりません。ハードウエアをそのまま管理していては、こうしたサービスは実現不可能でしょう。現在のクラウドサービスを実現するには、仮想化の技術が必要不可欠となっているのです。

【参考リンク】

富士ソフト

クラウドナビ