問題一覧
1
第1回 誰もが等しくデータの消費者生産者である社会を、①という
データ化社会
2
第1回 ①は、データを知り、データを活用することである。
データサイエンス
3
第1回 データを読む力、説明する力、扱う力のことを、①という。
データリテラシー
4
第1回 社会人として身につけるべきデータリテラシーは、データを読む力、説明する力、扱う力のほかに、データを①する力、データから②を見つける力、データから③する力である。
分類, 法則, 予測
5
第1回 データサイエンスは、①が定まっていない新しい学問で、②+③×④である。
定義, 統計学, 情報科学, 社会展開
6
第1回 データサイエンティストは、ビッグデータなど多種多様で膨大なデータを①して、そこから有用な情報の②を引き出すことのできる人材である。
処理・分析, 付加価値
7
第1回 データサイエンティストには、①、②、③の三位一体のスキルが必要である。
統計学, エンジニアリング, ビジネススキル
8
第1回 統計学は、データの構造を読み解くことを目的としており、①を導く、①を検証するなど、データサイエンスにおけるすべての土台となる知識・技術である。
仮説
9
第1回 ビジネススキルとは、分析した結果をどうすれば良いのか考えるスキルで、①などの知識が必要である。
ビジネスマーケティング
10
第1回 データサイエンティストのトレンドは3つある。 一つ目は、幅広い①。 二つ目は、②の上昇。 三つ目は、③。
知識, 需要, 人材不足
11
第1回 データサイエンスでは、高校教科書レベルの、線形代数と微分積分の基礎知識が必要であるが、複雑な手計算は不要であり、①だけは抑えることが必要。
概念
12
第1回 データサイエンスの要素技術は、 ⑴基盤となる①、⑵データを収集し、②する技術、⑶集めたデータを③する技術である。
知識・技術, 加工・処理, 解析
13
第2回 人間では扱いきれないほどのデータが集まるようになったが、インターネットの普及の時代 は、( ① )の発信であり、その後、IoT などの変化の時代である、( ② )の発信により大量のデータが集まるようになった。このような大量のデータを( ③ )という。
人, モノ, ビッグデータ
14
第2回 ビッグデータの「4 つの V」は、データの( ① )、データの( ② )、 データの( ③ )、データの( ④ )である
量, 種類, 頻度, 価値
15
第2回 IT の著しい発展を確信し、情報サービスの新たな展開に注力した巨大 IT 企業達を、その会社名の頭文字をとって( ① )という。
GAFA
16
第2回 主なビッグデータの例を3つ挙げよ。
マルチメディアデータ, ログデータ, オフィスデータ
17
第2回 ビッグデータの例に、時間の経過とともに観測されるデータである( ① )デー タがあり、株価や気温などのデータがそれにあたる
時系列
18
ビッグデータの本格的利用は、①により始まった。 キーワードを入力し、欲しい情報を得る行為を、代表的なサービス提供企業の名前から、「②」と言われている。
検索エンジン, ググる
19
第2回 インターネット上に公開されたサイトを閲覧するソフトウエアを、英語で①という。
ブラウザ
20
生産の自律化や産業界のデジタル化のことを、①という。
デジタルトランスフォーメーション
21
第2回 コンピュータの導入によって情報の重要性が高まった時代を①といい、すでに情報に関する技術が存在し、情報を自由に使える状態にある時代を②という。
情報化社会, 情報社会
22
第2回 ビッグデータの解析結果に基づいて、次のアクションや意思決定を行ったり、課題の解決や新たな価値創造が進められる社会を①という。
データ駆動型社会
23
第2回 様々なモノをインターネットに繋げる技術でデータ駆動型社会へと加速させたのは、①である。
IoT
24
第2回 データベースとは、一般的には電子化されたデータを①で処理できるように整理されたデータの②のことである。 特に、データを二次元の表形式で保持・管理するもので、最も広く使われているものを、③と呼ぶ。
コンピュータ, 集合体, リレーショナルデータベース
25
第3回 デジタル辞書によると、物事の推論の基本となる事実、または参考となる資料・情報のことを①という。
データ
26
第3回 代表的なデータの種類は4つある。 ①四則演算・比率計算が可能 ②差に意味があり、加減算は可能だが乗除はできない。 ③四則演算に意味がない。 ④数字そのものに意味がなく、「同じものか、違うものか」の判断だけ可能
比率データ, 間隔データ, 順位(順序)データ, 名義(カテゴリ)データ
27
第3回 データサイエンティストは、データを読み解く際、そのデータを読む目的やデータの裏にある①を考えながらデータを見る。
背景
28
第3回 データサイエンスでは、データを①し、可視化することで新しい価値が生まれる。
計量化
29
第3回 変動しているデータの集団を、一つの数値で代表させた値である「代表値」を3種類こたえよ。
平均値, 中央値, 最頻値
30
第3回 変動しているデータの集団の、散らばり具合を表した値である「散布度」を4種類えらべ。
四分位数, 分散, 標準偏差, 変動係数
31
第3回 「平均値」とは、データの値の合計を、データの①で割った値である。
総数
32
第4回 ほかのデータと比べて極端に大きい値や小さい値を①という。
外れ値
33
第4回 外れ値の中でも、記録ミスや測定ミスなどの、「値が極端な理由・原因」がわかっている値を、①という。
異常値
34
第4回 データが存在しないことを①という。
欠損
35
第4回 ある条件下でデータの取得が終了したデータを、①という。
打ち切りデータ
36
第4回 データサイエンスでは、2つのデータの関係性を確認する際には、①を利用する。
散布図
37
第4回 一方のデータが大きいと、もう一方のデータも大きいという関係性を①という。
相関関係
38
第4回 相関関係の中でも、一方が原因で、もう一方が結果である関係を、①という。
因果関係
39
第4回 見かけ上、相関関係があるように見えるが、データ間に因果関係がないものを①という。
擬似相関
40
第4回 2つのデータに影響を与えて相関を高くするような隠れた第三の要因のことを、①という。
交絡要因
41
第4回 「分散S²」は、平均値をもとに、データの①を表すものである。
ばらつき
42
第4回 「標準偏差」は、分散の①を取ることで算出できる。
平方根
43
第5回 データサイエンスでは、データを①することで、入手したデータの特徴や相違点、関連性を見つけ出す。
可視化
44
第5回 データの量(値)を表現するグラフで、項目の値の比較や差を確認したい場合に利用するグラフを①という。
棒グラフ
45
第5回 データの推移(変化)を表現するグラフで、データの時間的変化を確認したり、データのトレンドや周期性、データの変曲点などを確認したりするグラフを①という。
折れ線グラフ
46
第5回 データの関係性(相関)を表現するグラフで、2つの項目間に相関があるかを確認したり、データの偏りやばらつきを確認するグラフを①という。
散布図
47
第5回 グラフ作成においては、原点が①から始まってないグラフは、読み手に誤解を与えてしまう可能性があるため、使い方に注意が必要。
0
48
第5回 世の中にあるさまざまなデータの特徴を把握するための3原則には、①と②と③について理解する必要がある。
対象, 属性, 尺度
49
第5回 アンケート調査等でデータの意味や特徴を代数(記号)であらわした「箱」を①という。
変数
50
第5回 ①データの数値が連続量である変数 ②データの数値が離散量である変数 ③データの数値が名義的(数字に意味がない)である変数
連続変数, 離散変数, カテゴリ変数
51
第5回 集めた分析用のデータは、データを眺めているだけではダメで、まずは変数ごとにデータを集計して、分布の①を見ることが重要である。
特徴
52
第5回 アンケート調査などで収集した回答データに対し、設問の回答を掛け合わせて集計することを①という。
クロス集計
53
第5回 量的データの分布の様子を見るために、データをいくつかの階層に分け、①を作成し、グラフ化したものを②という。
度数分布表, ヒストグラム
54
第5回 四分位数を可視化したもので、データのばらつき具合を見やすくし、異なる複数のデータの比較が可能なものを、①という。
箱ひげ図
55
第6回 政府がインターネットで提供している日本の統計が閲覧できるサイトを①といい、人口、国土、労働、工業、家計など②分野で643の調査データを提供している。
e-Stat, 17
56
第6回 e-Statで提供されているデータの例として、①、②、③などがある。
国勢調査, 人口動態調査, 家計調査
57
第6回 ①とは、調査対象全員に行う調査である。例えば、国勢調査では、日本の②を母集団として実施している。
全数調査, 世帯全体
58
第6回 ①は、調査対象の一部に行う調査で、ほとんどの統計調査がこれにあたる。
標本調査
59
第6回 ①とは、調べたい対象全体からなる集団で、②とは、統計調査で抽出された①の一部である。
母集団, 標本
60
第6回 母集団から標本を選ぶときに、各対象者を完全にランダムに選ぶことを「無作為抽出」といい、英語では①という。
ランダムサンプリング
61
第6回 標本を恣意的に選ぶとデータに偏りが発生する。この偏りのことを、(標本〇〇〇〇)という。
バイアス
62
第6回 標本の抽出方法 ①標本をくじ引きのように無作為に抽出する方法 ②似た性質の対象をグループにして、各グループから標本を階層的に抽出する方法 ③母集団全体をいくつかの集団に分ける方法 ④母集団全体に通し番号をつけ、均等な感覚に標本を選ぶ方法。 ⑤ ③の方法を何度か繰り返し、最後に選ばれた中からランダムに標本を選ぶ
無作為抽出, 層化抽出, クラスター抽出, 系統抽出, 多段抽出
63
第6回 標本は母集団のごく一部であるため、標本から得られた結果には、必ず確率的な誤差が伴う。これを①という。
標本誤差
64
第6回 ①ある事象が起こる割合を数字(データ)で得ること。 ②得られたデータから、ある事象が起こる現象を分析すること。
確率論, 統計学
65
第6回 ①により、満遍なく標本が抽出されれば、母集団はある一定の②で表現できる。
無作為抽出, 分布形
66
第6回 正規分布は、釣り鐘型の①な分布で、②とも呼ばれる。
左右対称, ガウス分布
67
①とは、大量に観察することにより、平均値がその理論値に近づき安定することを言い、「集団の安定性」とも言われる。
大数の法則
68
第6回 一般的によく起こる現象は、正規分布で表現できると言われている。これを①という。
中心極限定理
69
第6回 正規分布は、①と②によって分布形が定まる。
平均値, 分散
70
第6回 正規分布は、①関数で表される。このような定式化のことを②という。
確率密度, 統計モデル
71
第6回 統計モデルにはいろいろな分布があるが、代表的なものには、①、②、③などがある。
正規分布, 二項分布, ポワソン分布
72
第6回 データに合うようにパラメータを選ぶことを、パラメータの①という。 機械学習では、モデルの②という。 パラメータが等しいか、ある範囲に入るかなどを、モデルの③という。 これらをまとめて④という。
推定, 学習, 検定, 推測統計
73
第7回 インターネットの発展は、データサイエンスにとって重要な要素である。特に1993年の①の概念によって、世界中の情報が一瞬にして入手できるようになったことが大きい。
WWW
74
第7回 インターネットの検索サービスの例を2つ挙げよ。
Google, Yahoo!
75
第7回 インターネットの通信量のことを①という。
トラフィック
76
第7回 ①の普及が、データサイエンスの発展につながっている。
スマートフォン
77
第7回 モノとモノが繋がる時代を、①の時代という。
IoT
78
第7回 膨大なデータは端末側で保存・処理し、端末で処理・集約された少量のデータだけを送信(通信)することを①という。
エッジコンピューティング
79
第7回 人工知能(AI)の正式名称は、Artificial Intelligenceで、①をコンピュータ上で実現しようとする技術・研究のこと。
人間の知能
80
第7回 AIの実態は、知能を持っているかのように①振る舞うようにプログラムされたコンピュータである。
賢く
81
第7回 1956年に、AIという言葉が提唱された会議は、①会議である。
ダートマス
82
第7回 第二次AIブームである1980年以降に登場した、専門家のように「知識」をルールとして教え込み解決する技術を、①という。
エキスパートシステム
83
第7回 AIが急激に進化を遂げた理由は、自ら学習させる①という技術の発展が大きい。
機械学習
84
第7回 ①:これまで主流だった、AIに正解データを与え、答え合わせができるようにして学習させる方法。 ②:現在の主流である、正解を与えず、入力したデータの中から、AIが自ら特定のパターンやルールを見つけ出す方法。
教師あり学習, 教師なし学習
85
第7回 ①:人間の脳の神経細胞の働きを模倣した技術。 ②:①の技術を多階層化した技術。
ニューラルネットワーク, ディープラーニング
86
第7回 ディープラーニングとは、機械学習の一つで、①とも呼ばれている。
深層学習
87
第7回 AIが不得意なことは、①の流れや、相手の②を読むことである。
会話, 気持ち
88
第7回 人工知能は、ある特定の状況や問題において、知的にふるまう①人工知能と、人間と同様に、様々な状況や問題において、知的にふるまいができる②人工知能がある。
特化型, 汎用型
89
第7回 AIはまだまだ進化の途中で、2045年にAIが人を超える、①(=特異点)が到来すると言われている。
シンギュラリティ