ログイン

データサイエンス概論

データサイエンス概論
171問 • 1年前
  • Daniel
  • 通報

    問題一覧

  • 1

    誰もが等しくデータの消費者・生産者である社会を、(      )という

    データ化社会

  • 2

    データを読む力、説明する力、扱う力、のことを、(         )という

    データリテラシー

  • 3

    社会人として身につけるべきデータリテラシーは、データを読む力、データを説明する力、データを扱う力、の他に、データを(  )する力、データから(  )を見つける力、データから(  )する力、である

    分類, 法則, 予測

  • 4

    データサイエンスは、(  )が定まっていない新しい学問で、(   )+(    )×(    )である

    定義, 統計学, 情報科学, 社会展開

  • 5

    データサイエンティストは、ビッグデータなど多種多様で膨大なデータを(  )・(  )して、そこから有用な情報(    )を引き出すことのできる人材である。

    処理, 分析, 付加価値

  • 6

    データサイエンティストには、(   )、(        )、(       )の三位一体のスキルが必要である

    統計学, エンジニアリング, ビジネススキル

  • 7

    統計学は、データの構造を読み解くことを目的としており、(  )を導く、仮説を検証する、など、データサイエンスにおけるすべての土台となる知識・技術である。

    仮説

  • 8

    ビジネススキルは、分析した結果をどうすればよいのか考えるスキルで、ビジネス・(       )などの知識が必要である。

    マーケティング

  • 9

    データサイエンティストのトレンドは、幅広い(  )、需要の上昇、(    )である

    知識, 人材不足

  • 10

    データサイエンスでは、高校教科書レベルの、線形代数と微分積分の基礎知識が必要であるが、複雑な手計算は不要であり、(  )だけは押さえることが必要。

    概念

  • 11

    人間では扱いきれないほどのデータが集まるようになったが、インターネットの普及の時代は、( )の発信であり、その後、IoTなどの変化の時代である、(  )の発信により大量のデータが集まるようになった。このような大量のデータを(      )という。

    人, モノ, ビッグデータ

  • 12

    ビッグデータの「4つのV」は、データのvolume( )、データのvariety(  )、データのvalue(  )、データのvelocity(  )である

    量, 種類, 価値, 頻度

  • 13

    ITの著しい発展を確信し、情報サービスの新たな展開に注力した巨大IT企業達を、その会社名の頭文字をとって(  )という。

    GAFA

  • 14

    ビッグデータの例に、時間の経過とともに観測されるデータである(   )データがあり、株価や気温などのデータがそれにあたる。

    時系列

  • 15

    ビッグデータの本格的利用は、(      )により始まった。キーワードを入力し、欲しい情報を得る行為を、代表的なサービス提供企業の名前から、(   )と言われている。

    検索エンジン, ググる

  • 16

    インターネット上に公開されたサイトを閲覧するソフトウェアを、英語では(    )という。

    ブラウザ

  • 17

    生産の自律化や産業界のデジタル化のことを、(            )という。

    デジタルトランスフォーメーション

  • 18

    コンピュータの導入によって情報の重要性が高まった時代を、(     )といい、すでに情報に関する技術が存在し、情報を自由に使える状態にある時代を(    )という

    情報化社会, 情報社会

  • 19

    ビッグデータの解析結果にもとづいて、次のアクションや意志決定を行ったり、課題の解決や新たな価値創造が進められる社会を(        )という。

    データ駆動型社会

  • 20

    デジタル辞書によると、物事の推論の基礎となる事実、または、参考となる資料・情報のことを、(   )という。

    データ

  • 21

    データサイエンティストは、データを読み解く際、そのデータを読む目的やデータの裏にある、(  ) を考えながらデータを見る。

    背景

  • 22

    「平均値」とは、データの値の合計を、データの(  )で割った値である。

    総数

  • 23

    次の数列[4、12、33、54、21]の「平均値」は、(  )である。

    24.8

  • 24

    次の数列[4、12、33、54、21]の「中央値」は、( )である。

    21

  • 25

    次の数列[4、12、33、54、12]の「最頻値(Mode)」は、( )である。

    12

  • 26

    他のデータと比べて極端に大きい値や小さい値を、(   )という

    外れ値

  • 27

    外れ値の中でも、記録ミスや測定ミスなどの、「値が極端な原因・理由」がわかっている値を、(   )という。

    異常値

  • 28

    「標準偏差」は、分散の(   )を取ることで算出できる。

    平方根

  • 29

    (   )とは、調べたい対象全体からなる集団で、(  )とは、統計調査で抽出された母集団の一部である。

    母集団, 標本

  • 30

    母集団から標本を選ぶ際に、各対象者を完全にランダムに選ぶことを、「無作為抽出」といい、英語では、(          )という。

    ランダムサンプリング

  • 31

    インターネットの検索サービスの例を二つ挙げよ。 (    )(    )

    google, yahoo!

  • 32

    (       )の普及がデータサイエンスの発展に繋がっている

    スマートフォン

  • 33

    モノとモノとが繋がる時代を、(  )の時代という

    IoT

  • 34

    膨大なデータは端末側(ローカル)で保存・処理し、端末で処理・集約された少量のデータだけを送信(通信)することを(          )という。

    エッジコンピューティング

  • 35

    機械学習とはAIが自ら学習するもので、これまで主流であった、AIに正解データを与え、答え合わせができるようにして学習させる(    )学習と、現在の主流である、正解を与えずに、入力したデータの中から、AIが自ら特定のパターンやルールを見つけ出す(    )学習がある。

    教師あり, 教師なし

  • 36

    AIが不得意なことは、(  )の流れや相手の(   )を読むことである

    会話, 気持ち

  • 37

    AIはまだまだ進化の途中で、2045年にAIが人を超える(       )(特異点)が到来すると言われている

    シンギュラリティ

  • 38

    データサイエンスの要素技術は、①基盤となる(    )、②データを収集し、(    )する技術、③集めたデータを(  )する技術である。

    知識・技術, 加工・処理, 解析

  • 39

    データベースとは、一般的には電子化されたデータを、(     )で処理できるように整理されたデータの(   )のことである。特に、データを2次限の表形式で保持・管理するもので、最も広くつかわれているものを、(           )(RDB)と呼ぶ。

    コンピュータ, 集合体, リレーショナルデータベース

  • 40

    変動しているデータの集団を、一つの数値で代表させた値である「代表値」には、(   )、(   )、(   )がある。

    平均値, 最頻値, 中央値

  • 41

    変動しているデータの集団を、散らばり具合を表した値である「散布度」には、(    )、(  )、(    )、(    )などがある。

    四分位数, 分散, 標準偏差, 変動係数

  • 42

    データが存在しないことを、(  )という。

    欠損

  • 43

    ある条件下でデータの取得が終了したデータを、(       )という。

    打ち切りデータ

  • 44

    一方のデータが大きいと、もう一方のデータも大きいという関係性を、(    )という。

    因果関係

  • 45

    変動しているデータの集団を、散らばり具合を表した値である「散布度」には、(    )、(  )、(    )、(    )がある。

    四分位数, 分散, 標準偏差, 変動係数

  • 46

    「分散s2」は、平均値をもとに、データの(      )を表すものである。

    ばらつき具合

  • 47

    統計調査(e-Stat)とは、日本の統計が閲覧できるポータルサイトで、政府がインターネットで提供している。人口、国土、労働、工業、家計など( )分野で、643の調査データを提供している(2020年10月現在)。例えば、(    )(      )(    )などのデータが提供されている。

    17, 国勢調査, 人口動態調査, 家計調査

  • 48

    (    )は、調査対象の一部に行う調査で、ほとんどの統計調査は標本調査である。

    標本調査

  • 49

    標本の抽出方法には、無作為抽出と(    )、(      )、系統抽出、多段抽出、などがある。

    層化抽出, クラスター抽出

  • 50

    標本は母集団のごく一部であるため、標本から得られた結果には、必ず確率的な誤差が伴う。これを(    )という。

    標本誤差

  • 51

    (   )は、ある事象が起こる割合を数字(データ)で得ることである。一方、(   )は、得られたデータから、ある事象が起こる現象を分析すること。

    確率論, 統計学

  • 52

    正規分布は、釣り鐘型の(    )な分布で、(     )とも呼ばれる。

    左右対称, ガウス分布

  • 53

    統計モデルにはいろいろな分布があるが、代表的なものには、(    )、(    )、(      )などがある。

    正規分布, 二項分布, ポワソン分布

  • 54

    機械学習では、モデルの(  )という。

    学習

  • 55

    機械学習では、モデルの(  )という。

    学習

  • 56

    人工知能(AI)の正式名称(英語)は、(Artificial Intelligence)で、(     )をコンピュータ上で実現しようとする技術・研究のこと

    人間の知能

  • 57

    AIの実態は、知能を持っているかのように、(  )振る舞うようにプログラムされたコンピュータである

    賢く

  • 58

    1956年に、AIという言葉が提唱された会議は、(     )会議である

    ダートマス

  • 59

    機械学習の凄い技術には、人間の脳の神経細胞の働きを模倣した(             )や、さらに、その技術を多階層化した(         )がある

    ニューラルネットワーク, ディープラーニング

  • 60

    ディープラーニング (Deep Learning) とは、機械学習の一つで、(    )とも呼ばれている

    深層学習

  • 61

    人工知能は、ある特定の状況や問題において知的にふるまう(   )人工知能と、人間と同様に様々な状況・問題において知的にふるまいができる(   )人工知能がある

    特化型, 汎用型

  • 62

    (        )は、データを知り、データを活用することである

    データサイエンス

  • 63

    データサイエンスでは、2つのデータの関係性を確認する際には、(   )を利用する。

    散布図

  • 64

    一方のデータが大きいと、もう一方のデータも大きいという関係性を、(    )という。

    相関関係

  • 65

    見かけ上、相関関係があるように見えるが、データ間に因果関係がないものを、(    )という。

    擬似相関

  • 66

    (   )抽出により、満遍なく標本が抽出されれば、母集団はある一定の(   )で表現できる。

    無作為, 分布形

  • 67

    パラメータが等しいか、ある範囲に入るかなど、モデルの(  )という。

    検定

  • 68

    インターネットの「通信量」のことを、(     )という。

    トラフィック

  • 69

    データサイエンスでは、データを(   )し、可視化することで新しい価値が生まれる。

    計量化

  • 70

    2つのデータに影響を与えて相関を高くするような隠れた第三の要因のことを、(    )という。

    交絡要因

  • 71

    (    )とは、調査対象全員に行う調査である。例えば、国勢調査では、日本の(    )を母集団として実施している。

    全数調査, 世帯全数

  • 72

    (     )とは、大量に観察することにより、平均値がその理論値に近づき安定することをいい、「集団の安定性」ともいわれる。

    大数の法則

  • 73

    パターン認識の二つの分類: 分類:(    )学習:パラメトリック、ノンパラメトリック検定など クラスター化:(    )学習:クラスター分析、主成分分析など

    教師あり, 教師なし

  • 74

    線形回帰分析は、多変量解析の代表格であり、非常にシンプルな分析手法で、簡単に実装できるが、予測に使うには(  )を期待できないなどの特徴がある。また、結果の(  )が容易であるため、実務で使われることが多い。

    精度, 解釈

  • 75

    線形回帰分析では、二つのデータの関係を、「y=ax+b」などの方程式に置き換える。このとき、xが1つの場合が、「(     )」、xが複数の場合を、「(     )」という。

    単回帰分析, 重回帰分析

  • 76

    説明変数に利用するデータには、(  )的データと(  )的データの2種類がある。

    定量, 定性

  • 77

    従来の統計学は、データがたくさん無いと(  )な結果が出せない上、データを入手するたびに(    )による再計算が必要であった

    正確, 全データ

  • 78

    ベイズ統計学の考え方は、(  )確率を、新しく得られた情報で更新し、(  )確率を算出する。

    事前, 事後

  • 79

    パターン認識の流れ: データ入力 → 前処理 → (    )→ (    )→ 結果出力

    特徴抽出, 分類識別

  • 80

    決定木とは、あるデータ群をいくつかのクラスに分けるため、いくつかの判断経路とその分類結果を(   )によって視覚的に表現する方法。

    木構造

  • 81

    また、y=ax+bで表される回帰式において、yを(  )変数といい、xを(  )変数という。

    目的, 説明

  • 82

    非線形回帰分析では、変数を対数に変換する、(    )を行うことで、直線の単回帰分析が可能となる場合もある。

    対数変換

  • 83

    ベイズ統計学の歴史は、1763年(         )によって提唱された。

    トーマス・ベイズ

  • 84

    長い間、避けられてきたベイズ統計は、使う人の恣意性や(   )な確率が取り込まれてしまうという問題があった上、(    )が複雑で解析的に解けないことも多かった

    主観的, 積分計算

  • 85

    一方、ベイズ統計学は、少ないデータでもある程度の結果が出せ、(      )から予測できる。しかも、考え方が比較的分かりやすい

    曖昧なデータ

  • 86

    ベイズ統計学の活用事例には、(       )の振り分け、(       )の予測変換、漢字変換・スタンプ予測、おススメ商品表示、などがある。

    スパムメール, 検索エンジン

  • 87

    パターン認識とは、観測されたパターンをある(    )に分類する操作のこと。画像データや音声データを(  )する場合などにおいてよく利用される。

    カテゴリー, 識別

  • 88

    因子分析とは、多変量データを説明する潜在的な少数の(  )を見つける方法。説明変数を(  )因子と特殊因子に分解する点において、主成分分析との違いがある。

    因子, 共通

  • 89

    k-NN法とは、統計的な分布を仮定しない(           )な手法で、データ間の(  )に基づいて分類する方法である。

    ノンパラメトリック, 距離

  • 90

    定性的な説明変数のうち、文字データを0と1に数値化(二値化)し、説明変数に入れるものを、(   )変数という。

    ダミー

  • 91

    近年、注目されてきたベイズ統計は、コンピュータの(    )や(    )の台頭(解析手法の進化)により注目されてきた

    高性能化, 機械学習

  • 92

    記述統計学は、サンプルをもとに、集計し視覚化することで事象を理解する学問で、推測統計学は、そのサンプルからそのデータ群の全体である(   )を予測するものである。一方、ベイズ統計学は、サンプル数が少ない状態から、ある事象を予測するもので、(   )を使う点において、前者とは異なる。

    母集団, 確率論

  • 93

    事前分布と事後分布の定義 ・(    ):情報(データ)を入手する前に想定していた確率分布 ・(    ):情報(データ)を用いて事前分布を修正した確率分布 ・(  ):データのもっともらしさの度合い

    事前分布, 事後分布, 尤度

  • 94

    教師なし学習の代表的な手法は、(     )、(    )、(       )。

    主成分分析, 因子分析, クラスター分析

  • 95

    主成分分析とは、多変量データの特徴を抽出し、いくつかのカテゴリーに分類するための、新しい(    )を求める方法。

    合成変数

  • 96

    多変量解析とは、複数の(  )を持つデータの統計解析を行う手法であり、複雑な現象の解析を行い、(    )の予測を行うことを目的とする解析手法である。

    変数, 目的変数

  • 97

    線形回帰分析の評価尺度について、複数の線形回帰式があり、どちらの式が適切か判断に迷う場合は、(      :  )にて評価し、この評価値が小さい直線式が最適な回帰モデルとなる。

    平均二乗誤差, MSE

  • 98

    教師あり学習の代表的な手法は、(    )、(    )、(        )などがある。

    k-NN法, 判別分析, ロジスティック回帰分析

  • 99

    ロジスティック回帰分析とは、時間経過の中で起こる現象を解析する(     )や機械学習における(     )の一つの手法として利用。

    時系列分析, 分類・識別

  • 100

    広い意味で捉えると、変数の多いデータの解析は、そのほとんどが(     )と言える。代表的なものに、単回帰分析や重回帰分析などの(      )がある。

    多変量解析, 線形回帰分析

  • データサイエンス概論.1

    データサイエンス概論.1

    Daniel · 83問 · 1年前

    データサイエンス概論.1

    データサイエンス概論.1

    83問 • 1年前
    Daniel

    データサイエンス概論.2

    データサイエンス概論.2

    Daniel · 39問 · 1年前

    データサイエンス概論.2

    データサイエンス概論.2

    39問 • 1年前
    Daniel

    データサイエンス概論.3

    データサイエンス概論.3

    Daniel · 49問 · 1年前

    データサイエンス概論.3

    データサイエンス概論.3

    49問 • 1年前
    Daniel

    環境気象学

    環境気象学

    Daniel · 20問 · 1年前

    環境気象学

    環境気象学

    20問 • 1年前
    Daniel

    社会環境調査法Ⅱ

    社会環境調査法Ⅱ

    Daniel · 20問 · 1年前

    社会環境調査法Ⅱ

    社会環境調査法Ⅱ

    20問 • 1年前
    Daniel

    環境データ循環学

    環境データ循環学

    Daniel · 15問 · 1年前

    環境データ循環学

    環境データ循環学

    15問 • 1年前
    Daniel

    環境調査分析

    環境調査分析

    Daniel · 20問 · 1年前

    環境調査分析

    環境調査分析

    20問 • 1年前
    Daniel

    環境と開発

    環境と開発

    Daniel · 19問 · 1年前

    環境と開発

    環境と開発

    19問 • 1年前
    Daniel

    環境統計解析学応用

    環境統計解析学応用

    Daniel · 20問 · 1年前

    環境統計解析学応用

    環境統計解析学応用

    20問 • 1年前
    Daniel

    環境と多文化共生

    環境と多文化共生

    Daniel · 20問 · 1年前

    環境と多文化共生

    環境と多文化共生

    20問 • 1年前
    Daniel

    経営データ・ESG投資分析

    経営データ・ESG投資分析

    Daniel · 71問 · 1年前

    経営データ・ESG投資分析

    経営データ・ESG投資分析

    71問 • 1年前
    Daniel

    環境プログラミング基礎

    環境プログラミング基礎

    Daniel · 11問 · 1年前

    環境プログラミング基礎

    環境プログラミング基礎

    11問 • 1年前
    Daniel

    農業・情報キャリア論

    農業・情報キャリア論

    Daniel · 14問 · 1年前

    農業・情報キャリア論

    農業・情報キャリア論

    14問 • 1年前
    Daniel

    環境気象学◎

    環境気象学◎

    Daniel · 18問 · 1年前

    環境気象学◎

    環境気象学◎

    18問 • 1年前
    Daniel

    環境データ循環学◎

    環境データ循環学◎

    Daniel · 6問 · 1年前

    環境データ循環学◎

    環境データ循環学◎

    6問 • 1年前
    Daniel

    環境気象学

    環境気象学

    Daniel · 17問 · 1年前

    環境気象学

    環境気象学

    17問 • 1年前
    Daniel

    社会環境調査法Ⅱ

    社会環境調査法Ⅱ

    Daniel · 20問 · 1年前

    社会環境調査法Ⅱ

    社会環境調査法Ⅱ

    20問 • 1年前
    Daniel

    環境データ循環学

    環境データ循環学

    Daniel · 15問 · 1年前

    環境データ循環学

    環境データ循環学

    15問 • 1年前
    Daniel

    問題一覧

  • 1

    誰もが等しくデータの消費者・生産者である社会を、(      )という

    データ化社会

  • 2

    データを読む力、説明する力、扱う力、のことを、(         )という

    データリテラシー

  • 3

    社会人として身につけるべきデータリテラシーは、データを読む力、データを説明する力、データを扱う力、の他に、データを(  )する力、データから(  )を見つける力、データから(  )する力、である

    分類, 法則, 予測

  • 4

    データサイエンスは、(  )が定まっていない新しい学問で、(   )+(    )×(    )である

    定義, 統計学, 情報科学, 社会展開

  • 5

    データサイエンティストは、ビッグデータなど多種多様で膨大なデータを(  )・(  )して、そこから有用な情報(    )を引き出すことのできる人材である。

    処理, 分析, 付加価値

  • 6

    データサイエンティストには、(   )、(        )、(       )の三位一体のスキルが必要である

    統計学, エンジニアリング, ビジネススキル

  • 7

    統計学は、データの構造を読み解くことを目的としており、(  )を導く、仮説を検証する、など、データサイエンスにおけるすべての土台となる知識・技術である。

    仮説

  • 8

    ビジネススキルは、分析した結果をどうすればよいのか考えるスキルで、ビジネス・(       )などの知識が必要である。

    マーケティング

  • 9

    データサイエンティストのトレンドは、幅広い(  )、需要の上昇、(    )である

    知識, 人材不足

  • 10

    データサイエンスでは、高校教科書レベルの、線形代数と微分積分の基礎知識が必要であるが、複雑な手計算は不要であり、(  )だけは押さえることが必要。

    概念

  • 11

    人間では扱いきれないほどのデータが集まるようになったが、インターネットの普及の時代は、( )の発信であり、その後、IoTなどの変化の時代である、(  )の発信により大量のデータが集まるようになった。このような大量のデータを(      )という。

    人, モノ, ビッグデータ

  • 12

    ビッグデータの「4つのV」は、データのvolume( )、データのvariety(  )、データのvalue(  )、データのvelocity(  )である

    量, 種類, 価値, 頻度

  • 13

    ITの著しい発展を確信し、情報サービスの新たな展開に注力した巨大IT企業達を、その会社名の頭文字をとって(  )という。

    GAFA

  • 14

    ビッグデータの例に、時間の経過とともに観測されるデータである(   )データがあり、株価や気温などのデータがそれにあたる。

    時系列

  • 15

    ビッグデータの本格的利用は、(      )により始まった。キーワードを入力し、欲しい情報を得る行為を、代表的なサービス提供企業の名前から、(   )と言われている。

    検索エンジン, ググる

  • 16

    インターネット上に公開されたサイトを閲覧するソフトウェアを、英語では(    )という。

    ブラウザ

  • 17

    生産の自律化や産業界のデジタル化のことを、(            )という。

    デジタルトランスフォーメーション

  • 18

    コンピュータの導入によって情報の重要性が高まった時代を、(     )といい、すでに情報に関する技術が存在し、情報を自由に使える状態にある時代を(    )という

    情報化社会, 情報社会

  • 19

    ビッグデータの解析結果にもとづいて、次のアクションや意志決定を行ったり、課題の解決や新たな価値創造が進められる社会を(        )という。

    データ駆動型社会

  • 20

    デジタル辞書によると、物事の推論の基礎となる事実、または、参考となる資料・情報のことを、(   )という。

    データ

  • 21

    データサイエンティストは、データを読み解く際、そのデータを読む目的やデータの裏にある、(  ) を考えながらデータを見る。

    背景

  • 22

    「平均値」とは、データの値の合計を、データの(  )で割った値である。

    総数

  • 23

    次の数列[4、12、33、54、21]の「平均値」は、(  )である。

    24.8

  • 24

    次の数列[4、12、33、54、21]の「中央値」は、( )である。

    21

  • 25

    次の数列[4、12、33、54、12]の「最頻値(Mode)」は、( )である。

    12

  • 26

    他のデータと比べて極端に大きい値や小さい値を、(   )という

    外れ値

  • 27

    外れ値の中でも、記録ミスや測定ミスなどの、「値が極端な原因・理由」がわかっている値を、(   )という。

    異常値

  • 28

    「標準偏差」は、分散の(   )を取ることで算出できる。

    平方根

  • 29

    (   )とは、調べたい対象全体からなる集団で、(  )とは、統計調査で抽出された母集団の一部である。

    母集団, 標本

  • 30

    母集団から標本を選ぶ際に、各対象者を完全にランダムに選ぶことを、「無作為抽出」といい、英語では、(          )という。

    ランダムサンプリング

  • 31

    インターネットの検索サービスの例を二つ挙げよ。 (    )(    )

    google, yahoo!

  • 32

    (       )の普及がデータサイエンスの発展に繋がっている

    スマートフォン

  • 33

    モノとモノとが繋がる時代を、(  )の時代という

    IoT

  • 34

    膨大なデータは端末側(ローカル)で保存・処理し、端末で処理・集約された少量のデータだけを送信(通信)することを(          )という。

    エッジコンピューティング

  • 35

    機械学習とはAIが自ら学習するもので、これまで主流であった、AIに正解データを与え、答え合わせができるようにして学習させる(    )学習と、現在の主流である、正解を与えずに、入力したデータの中から、AIが自ら特定のパターンやルールを見つけ出す(    )学習がある。

    教師あり, 教師なし

  • 36

    AIが不得意なことは、(  )の流れや相手の(   )を読むことである

    会話, 気持ち

  • 37

    AIはまだまだ進化の途中で、2045年にAIが人を超える(       )(特異点)が到来すると言われている

    シンギュラリティ

  • 38

    データサイエンスの要素技術は、①基盤となる(    )、②データを収集し、(    )する技術、③集めたデータを(  )する技術である。

    知識・技術, 加工・処理, 解析

  • 39

    データベースとは、一般的には電子化されたデータを、(     )で処理できるように整理されたデータの(   )のことである。特に、データを2次限の表形式で保持・管理するもので、最も広くつかわれているものを、(           )(RDB)と呼ぶ。

    コンピュータ, 集合体, リレーショナルデータベース

  • 40

    変動しているデータの集団を、一つの数値で代表させた値である「代表値」には、(   )、(   )、(   )がある。

    平均値, 最頻値, 中央値

  • 41

    変動しているデータの集団を、散らばり具合を表した値である「散布度」には、(    )、(  )、(    )、(    )などがある。

    四分位数, 分散, 標準偏差, 変動係数

  • 42

    データが存在しないことを、(  )という。

    欠損

  • 43

    ある条件下でデータの取得が終了したデータを、(       )という。

    打ち切りデータ

  • 44

    一方のデータが大きいと、もう一方のデータも大きいという関係性を、(    )という。

    因果関係

  • 45

    変動しているデータの集団を、散らばり具合を表した値である「散布度」には、(    )、(  )、(    )、(    )がある。

    四分位数, 分散, 標準偏差, 変動係数

  • 46

    「分散s2」は、平均値をもとに、データの(      )を表すものである。

    ばらつき具合

  • 47

    統計調査(e-Stat)とは、日本の統計が閲覧できるポータルサイトで、政府がインターネットで提供している。人口、国土、労働、工業、家計など( )分野で、643の調査データを提供している(2020年10月現在)。例えば、(    )(      )(    )などのデータが提供されている。

    17, 国勢調査, 人口動態調査, 家計調査

  • 48

    (    )は、調査対象の一部に行う調査で、ほとんどの統計調査は標本調査である。

    標本調査

  • 49

    標本の抽出方法には、無作為抽出と(    )、(      )、系統抽出、多段抽出、などがある。

    層化抽出, クラスター抽出

  • 50

    標本は母集団のごく一部であるため、標本から得られた結果には、必ず確率的な誤差が伴う。これを(    )という。

    標本誤差

  • 51

    (   )は、ある事象が起こる割合を数字(データ)で得ることである。一方、(   )は、得られたデータから、ある事象が起こる現象を分析すること。

    確率論, 統計学

  • 52

    正規分布は、釣り鐘型の(    )な分布で、(     )とも呼ばれる。

    左右対称, ガウス分布

  • 53

    統計モデルにはいろいろな分布があるが、代表的なものには、(    )、(    )、(      )などがある。

    正規分布, 二項分布, ポワソン分布

  • 54

    機械学習では、モデルの(  )という。

    学習

  • 55

    機械学習では、モデルの(  )という。

    学習

  • 56

    人工知能(AI)の正式名称(英語)は、(Artificial Intelligence)で、(     )をコンピュータ上で実現しようとする技術・研究のこと

    人間の知能

  • 57

    AIの実態は、知能を持っているかのように、(  )振る舞うようにプログラムされたコンピュータである

    賢く

  • 58

    1956年に、AIという言葉が提唱された会議は、(     )会議である

    ダートマス

  • 59

    機械学習の凄い技術には、人間の脳の神経細胞の働きを模倣した(             )や、さらに、その技術を多階層化した(         )がある

    ニューラルネットワーク, ディープラーニング

  • 60

    ディープラーニング (Deep Learning) とは、機械学習の一つで、(    )とも呼ばれている

    深層学習

  • 61

    人工知能は、ある特定の状況や問題において知的にふるまう(   )人工知能と、人間と同様に様々な状況・問題において知的にふるまいができる(   )人工知能がある

    特化型, 汎用型

  • 62

    (        )は、データを知り、データを活用することである

    データサイエンス

  • 63

    データサイエンスでは、2つのデータの関係性を確認する際には、(   )を利用する。

    散布図

  • 64

    一方のデータが大きいと、もう一方のデータも大きいという関係性を、(    )という。

    相関関係

  • 65

    見かけ上、相関関係があるように見えるが、データ間に因果関係がないものを、(    )という。

    擬似相関

  • 66

    (   )抽出により、満遍なく標本が抽出されれば、母集団はある一定の(   )で表現できる。

    無作為, 分布形

  • 67

    パラメータが等しいか、ある範囲に入るかなど、モデルの(  )という。

    検定

  • 68

    インターネットの「通信量」のことを、(     )という。

    トラフィック

  • 69

    データサイエンスでは、データを(   )し、可視化することで新しい価値が生まれる。

    計量化

  • 70

    2つのデータに影響を与えて相関を高くするような隠れた第三の要因のことを、(    )という。

    交絡要因

  • 71

    (    )とは、調査対象全員に行う調査である。例えば、国勢調査では、日本の(    )を母集団として実施している。

    全数調査, 世帯全数

  • 72

    (     )とは、大量に観察することにより、平均値がその理論値に近づき安定することをいい、「集団の安定性」ともいわれる。

    大数の法則

  • 73

    パターン認識の二つの分類: 分類:(    )学習:パラメトリック、ノンパラメトリック検定など クラスター化:(    )学習:クラスター分析、主成分分析など

    教師あり, 教師なし

  • 74

    線形回帰分析は、多変量解析の代表格であり、非常にシンプルな分析手法で、簡単に実装できるが、予測に使うには(  )を期待できないなどの特徴がある。また、結果の(  )が容易であるため、実務で使われることが多い。

    精度, 解釈

  • 75

    線形回帰分析では、二つのデータの関係を、「y=ax+b」などの方程式に置き換える。このとき、xが1つの場合が、「(     )」、xが複数の場合を、「(     )」という。

    単回帰分析, 重回帰分析

  • 76

    説明変数に利用するデータには、(  )的データと(  )的データの2種類がある。

    定量, 定性

  • 77

    従来の統計学は、データがたくさん無いと(  )な結果が出せない上、データを入手するたびに(    )による再計算が必要であった

    正確, 全データ

  • 78

    ベイズ統計学の考え方は、(  )確率を、新しく得られた情報で更新し、(  )確率を算出する。

    事前, 事後

  • 79

    パターン認識の流れ: データ入力 → 前処理 → (    )→ (    )→ 結果出力

    特徴抽出, 分類識別

  • 80

    決定木とは、あるデータ群をいくつかのクラスに分けるため、いくつかの判断経路とその分類結果を(   )によって視覚的に表現する方法。

    木構造

  • 81

    また、y=ax+bで表される回帰式において、yを(  )変数といい、xを(  )変数という。

    目的, 説明

  • 82

    非線形回帰分析では、変数を対数に変換する、(    )を行うことで、直線の単回帰分析が可能となる場合もある。

    対数変換

  • 83

    ベイズ統計学の歴史は、1763年(         )によって提唱された。

    トーマス・ベイズ

  • 84

    長い間、避けられてきたベイズ統計は、使う人の恣意性や(   )な確率が取り込まれてしまうという問題があった上、(    )が複雑で解析的に解けないことも多かった

    主観的, 積分計算

  • 85

    一方、ベイズ統計学は、少ないデータでもある程度の結果が出せ、(      )から予測できる。しかも、考え方が比較的分かりやすい

    曖昧なデータ

  • 86

    ベイズ統計学の活用事例には、(       )の振り分け、(       )の予測変換、漢字変換・スタンプ予測、おススメ商品表示、などがある。

    スパムメール, 検索エンジン

  • 87

    パターン認識とは、観測されたパターンをある(    )に分類する操作のこと。画像データや音声データを(  )する場合などにおいてよく利用される。

    カテゴリー, 識別

  • 88

    因子分析とは、多変量データを説明する潜在的な少数の(  )を見つける方法。説明変数を(  )因子と特殊因子に分解する点において、主成分分析との違いがある。

    因子, 共通

  • 89

    k-NN法とは、統計的な分布を仮定しない(           )な手法で、データ間の(  )に基づいて分類する方法である。

    ノンパラメトリック, 距離

  • 90

    定性的な説明変数のうち、文字データを0と1に数値化(二値化)し、説明変数に入れるものを、(   )変数という。

    ダミー

  • 91

    近年、注目されてきたベイズ統計は、コンピュータの(    )や(    )の台頭(解析手法の進化)により注目されてきた

    高性能化, 機械学習

  • 92

    記述統計学は、サンプルをもとに、集計し視覚化することで事象を理解する学問で、推測統計学は、そのサンプルからそのデータ群の全体である(   )を予測するものである。一方、ベイズ統計学は、サンプル数が少ない状態から、ある事象を予測するもので、(   )を使う点において、前者とは異なる。

    母集団, 確率論

  • 93

    事前分布と事後分布の定義 ・(    ):情報(データ)を入手する前に想定していた確率分布 ・(    ):情報(データ)を用いて事前分布を修正した確率分布 ・(  ):データのもっともらしさの度合い

    事前分布, 事後分布, 尤度

  • 94

    教師なし学習の代表的な手法は、(     )、(    )、(       )。

    主成分分析, 因子分析, クラスター分析

  • 95

    主成分分析とは、多変量データの特徴を抽出し、いくつかのカテゴリーに分類するための、新しい(    )を求める方法。

    合成変数

  • 96

    多変量解析とは、複数の(  )を持つデータの統計解析を行う手法であり、複雑な現象の解析を行い、(    )の予測を行うことを目的とする解析手法である。

    変数, 目的変数

  • 97

    線形回帰分析の評価尺度について、複数の線形回帰式があり、どちらの式が適切か判断に迷う場合は、(      :  )にて評価し、この評価値が小さい直線式が最適な回帰モデルとなる。

    平均二乗誤差, MSE

  • 98

    教師あり学習の代表的な手法は、(    )、(    )、(        )などがある。

    k-NN法, 判別分析, ロジスティック回帰分析

  • 99

    ロジスティック回帰分析とは、時間経過の中で起こる現象を解析する(     )や機械学習における(     )の一つの手法として利用。

    時系列分析, 分類・識別

  • 100

    広い意味で捉えると、変数の多いデータの解析は、そのほとんどが(     )と言える。代表的なものに、単回帰分析や重回帰分析などの(      )がある。

    多変量解析, 線形回帰分析