複数の公共デイタセットを結合する際の問題に関する考察
1) 早稲田大学
| Abstract | 現在、オウプンデイタの活用が推奨・推進され、政府により、各種デイタセットのみならず、これを分析するツールやサーヴィスも提供され始めている。しかし、これらの公的デイタセットの活用で予定されているのは、各デイタセット単独の分析である。他方、最も刺激的で価値もありそうな公的デイタセットの活用は、元来それぞれ独立に設計収集されたデイタセットの予期されなかった組み合わせの分析によって得られる可能性が大きい。ところが、複数デイタセットを結合、正規化、クレンジングするためのツールなどは、全く未整備の状態である。本稿は、統計分析に入る以前に必要な、複数デイタベイスの結合に関わる問題を論ずる。 | 
|---|---|
| Governments are promoting the use of open data, providing also tools and services. However, their presumed uses are mainly based on a single data set. Potentially most valuable uses of public data, however, consist of combining two or more data sets which are independently designed and collected. For this kind of use, there must be two prior conditions. First, the catalogue of existing open data sets must be available. Secondly, two or more data sets must be combined efficiently. As this is outside of the original scope of the data providors, tools and services to combine more than one data sets do not seem widely available. The article addresses these issues around combining two or more open/public data sets, as a preparation for statistical analyses. | |
| Keywords | オウプンデイタ,キー,結合 | 
| open data,key,combination | 






