ログイン

機械学習
69問 • 7ヶ月前
  • ユーザ名非公開
  • 通報

    問題一覧

  • 1

    (ア)に最もよく当てはまる選択肢を選んでください。 ウォード法は、似ている組み合わせから順番にクラスター化していく手法で、途中経過を(ア)で表すことができる。または、(ア)を(イ)という。

    3. 樹形図

  • 2

    (イ)に最もよく当てはまる選択肢を選んでください。 ウォード法は、似ている組み合わせから順番にクラスター化していく手法で、途中経過を(ア)で表すことができる。または、(ア)を(イ)という。

    3. デンドログラム

  • 3

    リバースエンジニアリングの説明として正しい選択肢を選択してください。

    1.製品などを分解・解析を行い、使用などを調査すること

  • 4

    現在、モデルの局所的な解釈を可能にするアプローチが考えられており、SHAPやLIMEなどといった手法がある。SHAPの説明として、正しい選択肢を選んでください。

    3. ゲーム理論におけるShapley値を利用して、それぞれの特徴量が予測にどの程度影響を与えたかを算出する手法

  • 5

    k近傍法の説明として正しい選択肢を選んでください。

    2. 分類に使われる手法の1つで、未知のデータが与えられたときに近くにあるデータをk個取得し、多数決でデータが所属するクラスを分類していく手法

  • 6

    (ア)に最もよく当てはまる選択肢を選んでください。 モデルの性能を評価する手法である交差検証には、(ア)、(イ)、(ウ)などがある。(ア)は、準備したデータをあらかじめ訓練データと評価用のテストデータに分けて、モデルの学習・評価を行う手法である。また、訓練データの一部を、検証データとして切り分ける場合もある。(イ)は、準備したデータを複数個(k個)に分割し、そのうち1つをテストデータ、残りを訓練データとして、モデルの学習・評価を行う手法である。(ウ)は、データ全体のうち1つをテストデータ、残りを訓練データとして、モデルの学習・評価を行う手法である。

    3. ホールドアウト検証

  • 7

    (イ)に最もよく当てはまる選択肢を選んでください。 モデルの性能を評価する手法である交差検証には、(ア)、(イ)、(ウ)などがある。(ア)は、準備したデータをあらかじめ訓練データと評価用のテストデータに分けて、モデルの学習・評価を行う手法である。また、訓練データの一部を、検証データとして切り分ける場合もある。(イ)は、準備したデータを複数個(k個)に分割し、そのうち1つをテストデータ、残りを訓練データとして、モデルの学習・評価を行う手法である。(ウ)は、データ全体のうち1つをテストデータ、残りを訓練データとして、モデルの学習・評価を行う手法である。

    4. k-分割交差検証

  • 8

    (ウ)に最もよく当てはまる選択肢を選んでください。 モデルの性能を評価する手法である交差検証には、(ア)、(イ)、(ウ)などがある。(ア)は、準備したデータをあらかじめ訓練データと評価用のテストデータに分けて、モデルの学習・評価を行う手法である。また、訓練データの一部を、検証データとして切り分ける場合もある。(イ)は、準備したデータを複数個(k個)に分割し、そのうち1つをテストデータ、残りを訓練データとして、モデルの学習・評価を行う手法である。(ウ)は、データ全体のうち1つをテストデータ、残りを訓練データとして、モデルの学習・評価を行う手法である。

    1. 1つ抜き交差検証

  • 9

    オッカムの剃刀の説明として正しい選択肢を選んでください。

    2. ある事柄を説明するためには、必要以上に多くを仮定するべきではない

  • 10

    アンサンブル学習の説明として最も適切な選択肢を選んでください。

    4. 精度の高くないモデルを複数組み合わせて、精度の高い予測を行う手法

  • 11

    与えられた環境下で、報酬が最大となる行動を行うように学習していく手法を(ア)という。

    4. 精度の高くないモデルを複数組み合わせて、精度の高い予測を行う手法

  • 12

    (ア)に最もよく当てはまる選択肢を選んでください。 次元削除の方法として、(ア)、(イ)、特異値分解、多次元尺度構成法などが有名である。(ア)は、t分布を活用して次元削減する手法である。(イ)は、相関関係のある変数をまとめてより少ない変数に要約する分析手法である。

    1. t-SNE法

  • 13

    (イ)に最もよく当てはまる選択肢を選んでください。 次元削除の方法として、(ア)、(イ)、特異値分解、多次元尺度構成法などが有名である。(ア)は、t分布を活用して次元削減する手法である。(イ)は、相関関係のある変数をまとめてより少ない変数に要約する分析手法である。

    3. 主成分分析

  • 14

    (ア)に最もよく当てはまる選択肢を選んでください。 ROC曲線は、(ア)と(イ)の関係を表した曲線のことである。縦軸を(ア)、横軸を(イ)をとる。

    3.真陽性率

  • 15

    (ア)に最もよく当てはまる選択肢を選んでください。 分類モデルの評価について、代表的な指標として(ア)、(イ)、(ウ)、(エ)がある。(ア)は、陽性と判断したデータのうち実際に陽性だった割合のことである。(イ)は、全データのうち正しく予測できた割合のことである。(ウ)は、適合率と再現率の調和平均のことである。(エ)は、陽性データの中で、正しく陽性と判断できた割合のことである。

    2. 適合率

  • 16

    (イ)に最もよく当てはまる選択肢を選んでください。 ROC曲線は、(ア)と(イ)の関係を表した曲線のことである。縦軸を(ア)、横軸を(イ)をとる。

    1.偽陽性率

  • 17

    (ア)に最もよく当てはまる選択肢を選んでください。 求めたい変数を1つ以上の変数を使って予測する手法を線形回帰分析という。線形回帰において、原因となる変数を(ア)、結果となる変数を(イ)という。また、回帰分析のうち(ア)が1つの分析を(ウ)、(ア)が複数の分析を(エ)という。

    2.説明変数

  • 18

    (イ)に最もよく当てはまる選択肢を選んでください。 求めたい変数を1つ以上の変数を使って予測する手法を線形回帰分析という。線形回帰において、原因となる変数を(ア)、結果となる変数を(イ)という。また、回帰分析のうち(ア)が1つの分析を(ウ)、(ア)が複数の分析を(エ)という。

    4.目的変数

  • 19

    (ウ)に最もよく当てはまる選択肢を選んでください。 求めたい変数を1つ以上の変数を使って予測する手法を線形回帰分析という。線形回帰において、原因となる変数を(ア)、結果となる変数を(イ)という。また、回帰分析のうち(ア)が1つの分析を(ウ)、(ア)が複数の分析を(エ)という。

    1.単回帰分析

  • 20

    (エ)に最もよく当てはまる選択肢を選んでください。 求めたい変数を1つ以上の変数を使って予測する手法を線形回帰分析という。線形回帰において、原因となる変数を(ア)、結果となる変数を(イ)という。また、回帰分析のうち(ア)が1つの分析を(ウ)、(ア)が複数の分析を(エ)という。

    3.重回帰分析

  • 21

    (ア)に最もよく当てはまる選択肢を選んでください。 訓練データ・検証データにテストデータにすべき未知のデータが入ってしまうことを(ア)という。

    2.データリーケージ

  • 22

    (ア)に最もよく当てはまる選択肢を選んでください。 教師あり学習の代表的な手法として、サポートベクターマシン(SVM)がある。サポートベクターマシン(SVM)は、(ア)という考え方を用いて分類を行う線を求めている。また、直線で分類できない場合、次元を拡張させることで分類する方法がある。次元を拡張させる関数を(イ)といい、(ウ)という方法を使うことで計算を楽にすることができる。

    3.マージン最大化

  • 23

    (イ)に最もよく当てはまる選択肢を選んでください。 教師あり学習の代表的な手法として、サポートベクターマシン(SVM)がある。サポートベクターマシン(SVM)は、(ア)という考え方を用いて分類を行う線を求めている。また、直線で分類できない場合、次元を拡張させることで分類する方法がある。次元を拡張させる関数を(イ)といい、(ウ)という方法を使うことで計算を楽にすることができる。

    3.カーネル関数

  • 24

    (ウ)に最もよく当てはまる選択肢を選んでください。 教師あり学習の代表的な手法として、サポートベクターマシン(SVM)がある。サポートベクターマシン(SVM)は、(ア)という考え方を用いて分類を行う線を求めている。また、直線で分類できない場合、次元を拡張させることで分類する方法がある。次元を拡張させる関数を(イ)といい、(ウ)という方法を使うことで計算を楽にすることができる。

    2.カーネルトリック

  • 25

    (ア)に最もよく当てはまる選択肢を選んでください。 状態が遷移するとき、過去の状態に依存しない特性を(ア)という。また、(ア)を満たす遷移過程モデルを(イ)という。

    1.マルコフ性

  • 26

    (ア)に最もよく当てはまる選択肢を選んでください。 ROC曲線よりも下の面積のことを(ア)という。面積が(イ)に近いほどモデルの性能は高いとされる。

    1.AUC

  • 27

    (イ)に最もよく当てはまる選択肢を選んでください。 ROC曲線よりも下の面積のことを(ア)という。面積が(イ)に近いほどモデルの性能は高いとされる。

    4. 1

  • 28

    ホールドアウト検証では、訓練データの一部を(ア)に分割する場合がある。また、(ア)は最終的なパラメータの調整のために使用される。

    4.検証データ

  • 29

    (ア)に最もよく当てはまる選択肢を選んでください。 行動を決めるアクターと価値を評価するクリティックで構成されている強化学習の手法を(ア)という。(ア)は、価値ベースと方策ベースの考え方を組み合わせた手法である。(ア)を応用した手法に(イ)がある。

    4. Actor-Critic

  • 30

    (イ)に最もよく当てはまる選択肢を選んでください。 行動を決めるアクターと価値を評価するクリティックで構成されている強化学習の手法を(ア)という。(ア)は、価値ベースと方策ベースの考え方を組み合わせた手法である。(ア)を応用した手法に(イ)がある。

    1. A3C

  • 31

    t-SNE法における「t」は(ア)を意味する。

    4. t分布

  • 32

    訓練データを学習しすぎた結果、未知のデータに対する精度が悪くなってしまう現象のことを(ア)という。

    2. 過学習

  • 33

    (ア)に最もよく当てはまる選択肢を選んでください。 訓練データに対する予測と正解の誤差を(ア)、未知データに対する予測と正解の誤差を(イ)という。

    4 訓練誤差

  • 34

    (イ)に最もよく当てはまる選択肢を選んでください。 訓練データに対する予測と正解の誤差を(ア)、未知データに対する予測と正解の誤差を(イ)という。

    2. 訓練誤差

  • 35

    自己回帰モデル(ARモデル)の説明として正しい選択肢を選んでください。

    ある時刻の値を、ある時刻よりも過去のデータを使って予測するモデルのこと

  • 36

    (ア)に最もよく当てはまる選択肢を選んでください。 分類モデルの評価について、代表的な指標として(ア)、(イ)、(ウ)、(エ)がある。(ア)は、陽性と判断したデータのうち実際に陽性だった割合のことである。(イ)は、全データのうち正しく予測できた割合のことである。(ウ)は、適合率と再現率の調和平均のことである。(エ)は、陽性データの中で、正しく陽性と判断できた割合のことである。

    2. 適合率

  • 37

    (イ)に最もよく当てはまる選択肢を選んでください。 分類モデルの評価について、代表的な指標として(ア)、(イ)、(ウ)、(エ)がある。(ア)は、陽性と判断したデータのうち実際に陽性だった割合のことである。(イ)は、全データのうち正しく予測できた割合のことである。(ウ)は、適合率と再現率の調和平均のことである。(エ)は、陽性データの中で、正しく陽性と判断できた割合のことである。

    1. 正解率

  • 38

    (ウ)に最もよく当てはまる選択肢を選んでください。 分類モデルの評価について、代表的な指標として(ア)、(イ)、(ウ)、(エ)がある。(ア)は、陽性と判断したデータのうち実際に陽性だった割合のことである。(イ)は、全データのうち正しく予測できた割合のことである。(ウ)は、適合率と再現率の調和平均のことである。(エ)は、陽性データの中で、正しく陽性と判断できた割合のことである。

    4. F値

  • 39

    (エ)に最もよく当てはまる選択肢を選んでください。 分類モデルの評価について、代表的な指標として(ア)、(イ)、(ウ)、(エ)がある。(ア)は、陽性と判断したデータのうち実際に陽性だった割合のことである。(イ)は、全データのうち正しく予測できた割合のことである。(ウ)は、適合率と再現率の調和平均のことである。(エ)は、陽性データの中で、正しく陽性と判断できた割合のことである。

    3. 再現率

  • 40

    (ア)に最もよく当てはまる選択肢を選んでください。 訓練データに対する予測と正解の誤差を(ア)、未知データに対する予測と正解の誤差を(イ)という

    4. 訓練誤差

  • 41

    (イ)に最もよく当てはまる選択肢を選んでください。 訓練データに対する予測と正解の誤差を(ア)、未知データに対する予測と正解の誤差を(イ)という

    2. 汎化誤差

  • 42

    (イ)に最もよく当てはまる選択肢を選んでください。 訓練データに対する予測と正解の誤差を(ア)、未知データに対する予測と正解の誤差を(イ)という

    2. 汎化誤差

  • 43

    (ア)に最もよく当てはまる選択肢を選んでください。 決定木において、分岐路を作るとき、(ア)が最大化するように分岐路を作っていく。(ア)は、分割前の(イ)から分割後の(イ)を引いたものである。(イ)の指標として(ウ)などがある

    1. 情報利得

  • 44

    (イ)に最もよく当てはまる選択肢を選んでください。 決定木において、分岐路を作るとき、(ア)が最大化するように分岐路を作っていく。(ア)は、分割前の(イ)から分割後の(イ)を引いたものである。(イ)の指標として(ウ)などがある

    4. 不純度

  • 45

    (ウ)に最もよく当てはまる選択肢を選んでください。 決定木において、分岐路を作るとき、(ア)が最大化するように分岐路を作っていく。(ア)は、分割前の(イ)から分割後の(イ)を引いたものである。(イ)の指標として(ウ)などがある

    3. エントロピー

  • 46

    (ア)に最もよく当てはまる選択肢を選んでください。 教師あり学習は、(ア)や(イ)を解くときによく使われる手法である。(ア)は複数のカテゴリに分ける問題であり、(イ)は連続値を予測する問題である。

    1. 分類問題

  • 47

    (ィ)に最もよく当てはまる選択肢を選んでください。 強化学習において、最適な(ア)を見つけることは重要だが、見つけ出すことは難しい。しかし、最適な(ア)を見つけ出すために、様々な研究が行われている。例えば、(ア)をパラメータのもった関数と定義して(ア)の価値が最大になるようにパラメータを学習させていくことで、最適な(ア)を見つけ出そうとする(イ)などがある

    2.方策勾配法

  • 48

    正則化の説明として、最もよく当てはまる選択肢を選んでください。

    パラメータ(重み)に制限をかけることで、複雑になりすぎたモデルをシンプルなモデルにしていくこと

  • 49

    (ィ)に最もよく当てはまる選択肢を選んでください。 強化学習において、最適な(ア)を見つけることは重要だが、見つけ出すことは難しい。しかし、最適な(ア)を見つけ出すために、様々な研究が行われている。例えば、(ア)をパラメータのもった関数と定義して(ア)の価値が最大になるようにパラメータを学習させていくことで、最適な(ア)を見つけ出そうとする(イ)などがある

    2.方策

  • 50

    (イ)に最もよく当てはまる選択肢を選んでください。 教師あり学習は、(ア)や(イ)を解くときによく使われる手法である。(ア)は複数のカテゴリに分ける問題であり、(イ)は連続値を予測する問題である。

    4.回帰問題

  • 51

    (ア)に最もよく当てはまる選択肢を選んでください。 強化学習とは、与えられた環境下で、(ア)が最大化する行動を学んでいくことである。また、エージェントの行動基準のことを(イ)という。

    1.報酬

  • 52

    (ィ)に最もよく当てはまる選択肢を選んでください。 強化学習とは、与えられた環境下で、(ア)が最大化する行動を学んでいくことである。また、エージェントの行動基準のことを(イ)という。 全体的な説明

    3.方策

  • 53

    教師あり学習の分類問題に関する例として、最も適切な選択肢を選択してください。

    4. 顧客の商品購入履歴から、ある商品を購入するかどうかを予測する

  • 54

    (ア)に最もよく当てはまる選択肢を選んでください。 ブースティングの代表的な手法に、(ア)や(イ)などがある。(ア)はモデルの最適化に勾配降下法を使用する手法であり、(イ)はYoav FreundとRobert Schapireによって考案された手法である。

    3.勾配ブースティング

  • 55

    (ィ)に最もよく当てはまる選択肢を選んでください。 ブースティングの代表的な手法に、(ア)や(イ)などがある。(ア)はモデルの最適化に勾配降下法を使用する手法であり、(イ)はYoav FreundとRobert Schapireによって考案された手法である。

    2.AdaBoost

  • 56

    (ア)に最もよく当てはまる選択肢を選んでください。 Q学習やSARSAは、(ア)の1種である。

    2.TD学習

  • 57

    階層クラスター分析において、クラスタ間の距離を測定する方法は複数存在する。例えば、ウォード法や(ア)などがある。

    3.群平均法

  • 58

    半教師あり学習に関する説明として、最も不適切な選択肢を選択してください。

    1.正解ラベル付きのデータは必要でない

  • 59

    自己回帰モデルを多変量に拡張したモデルを(ア)という。

    1.VARモデル

  • 60

    (ア)に最もよく当てはまる選択肢を選んでください。 アンサンブル学習には、一部のデータを抽出し、モデルを直列的に学習させていく(ア)や複数のモデルを並列的に学習させていく(イ)などがある。

    3.ブースティング

  • 61

    (ィ)に最もよく当てはまる選択肢を選んでください。 アンサンブル学習には、一部のデータを抽出し、モデルを直列的に学習させていく(ア)や複数のモデルを並列的に学習させていく(イ)などがある。

    1.バギング

  • 62

    教師あり学習の回帰問題に関する例として、最も適切な選択肢を選択してください。 全体的な説明

    2.気温、曜日などの情報から1日あたりのA店舗の売上を予測した

  • 63

    (ア)に最もよく当てはまる選択肢を選んでください。 正則化を行いすぎると(ア)になってしまう危険性があるので注意する必要がある。

    2.未学習

  • 64

    (ア)に最もよく当てはまる選択肢を選んでください。 強化学習における価値反復法では、状態価値を(ア)で初期化し、状態価値を更新していく。

    2. 0

  • 65

    回帰モデルの精度の評価指標に関する説明として、最も不適切な選択肢を選択してください。

    2. MAEはRMSEに比べて外れ値から大きな影響を受けてしまう

  • 66

    (ア)に最もよく当てはまる選択肢を選んでください。 k近傍法では、k=(ア)のとき、外れ値の影響を受けてしまい、予測精度が低下してしまう。

    1. 1

  • 67

    k近傍法の特徴の説明として、正しい選択肢を選択してください。

    1.クラスごとのデータ量に偏りがある場合、性能が低くなる可能性がある

  • 68

    (ア)に最もよく当てはまる選択肢を選んでください。 各データが1つのクラスタに所属するようにクラスタリングを行うことを(ア)という。一方、各データが1つ以上のクラスタに所属することを許すクラスタリングを(イ)という。

    1. ハードクラスタリング

  • 69

    (ィ)に最もよく当てはまる選択肢を選んでください。 各データが1つのクラスタに所属するようにクラスタリングを行うことを(ア)という。一方、各データが1つ以上のクラスタに所属することを許すクラスタリングを(イ)という。

    3.ソフトクラスタリング

  • 問題一覧

  • 1

    (ア)に最もよく当てはまる選択肢を選んでください。 ウォード法は、似ている組み合わせから順番にクラスター化していく手法で、途中経過を(ア)で表すことができる。または、(ア)を(イ)という。

    3. 樹形図

  • 2

    (イ)に最もよく当てはまる選択肢を選んでください。 ウォード法は、似ている組み合わせから順番にクラスター化していく手法で、途中経過を(ア)で表すことができる。または、(ア)を(イ)という。

    3. デンドログラム

  • 3

    リバースエンジニアリングの説明として正しい選択肢を選択してください。

    1.製品などを分解・解析を行い、使用などを調査すること

  • 4

    現在、モデルの局所的な解釈を可能にするアプローチが考えられており、SHAPやLIMEなどといった手法がある。SHAPの説明として、正しい選択肢を選んでください。

    3. ゲーム理論におけるShapley値を利用して、それぞれの特徴量が予測にどの程度影響を与えたかを算出する手法

  • 5

    k近傍法の説明として正しい選択肢を選んでください。

    2. 分類に使われる手法の1つで、未知のデータが与えられたときに近くにあるデータをk個取得し、多数決でデータが所属するクラスを分類していく手法

  • 6

    (ア)に最もよく当てはまる選択肢を選んでください。 モデルの性能を評価する手法である交差検証には、(ア)、(イ)、(ウ)などがある。(ア)は、準備したデータをあらかじめ訓練データと評価用のテストデータに分けて、モデルの学習・評価を行う手法である。また、訓練データの一部を、検証データとして切り分ける場合もある。(イ)は、準備したデータを複数個(k個)に分割し、そのうち1つをテストデータ、残りを訓練データとして、モデルの学習・評価を行う手法である。(ウ)は、データ全体のうち1つをテストデータ、残りを訓練データとして、モデルの学習・評価を行う手法である。

    3. ホールドアウト検証

  • 7

    (イ)に最もよく当てはまる選択肢を選んでください。 モデルの性能を評価する手法である交差検証には、(ア)、(イ)、(ウ)などがある。(ア)は、準備したデータをあらかじめ訓練データと評価用のテストデータに分けて、モデルの学習・評価を行う手法である。また、訓練データの一部を、検証データとして切り分ける場合もある。(イ)は、準備したデータを複数個(k個)に分割し、そのうち1つをテストデータ、残りを訓練データとして、モデルの学習・評価を行う手法である。(ウ)は、データ全体のうち1つをテストデータ、残りを訓練データとして、モデルの学習・評価を行う手法である。

    4. k-分割交差検証

  • 8

    (ウ)に最もよく当てはまる選択肢を選んでください。 モデルの性能を評価する手法である交差検証には、(ア)、(イ)、(ウ)などがある。(ア)は、準備したデータをあらかじめ訓練データと評価用のテストデータに分けて、モデルの学習・評価を行う手法である。また、訓練データの一部を、検証データとして切り分ける場合もある。(イ)は、準備したデータを複数個(k個)に分割し、そのうち1つをテストデータ、残りを訓練データとして、モデルの学習・評価を行う手法である。(ウ)は、データ全体のうち1つをテストデータ、残りを訓練データとして、モデルの学習・評価を行う手法である。

    1. 1つ抜き交差検証

  • 9

    オッカムの剃刀の説明として正しい選択肢を選んでください。

    2. ある事柄を説明するためには、必要以上に多くを仮定するべきではない

  • 10

    アンサンブル学習の説明として最も適切な選択肢を選んでください。

    4. 精度の高くないモデルを複数組み合わせて、精度の高い予測を行う手法

  • 11

    与えられた環境下で、報酬が最大となる行動を行うように学習していく手法を(ア)という。

    4. 精度の高くないモデルを複数組み合わせて、精度の高い予測を行う手法

  • 12

    (ア)に最もよく当てはまる選択肢を選んでください。 次元削除の方法として、(ア)、(イ)、特異値分解、多次元尺度構成法などが有名である。(ア)は、t分布を活用して次元削減する手法である。(イ)は、相関関係のある変数をまとめてより少ない変数に要約する分析手法である。

    1. t-SNE法

  • 13

    (イ)に最もよく当てはまる選択肢を選んでください。 次元削除の方法として、(ア)、(イ)、特異値分解、多次元尺度構成法などが有名である。(ア)は、t分布を活用して次元削減する手法である。(イ)は、相関関係のある変数をまとめてより少ない変数に要約する分析手法である。

    3. 主成分分析

  • 14

    (ア)に最もよく当てはまる選択肢を選んでください。 ROC曲線は、(ア)と(イ)の関係を表した曲線のことである。縦軸を(ア)、横軸を(イ)をとる。

    3.真陽性率

  • 15

    (ア)に最もよく当てはまる選択肢を選んでください。 分類モデルの評価について、代表的な指標として(ア)、(イ)、(ウ)、(エ)がある。(ア)は、陽性と判断したデータのうち実際に陽性だった割合のことである。(イ)は、全データのうち正しく予測できた割合のことである。(ウ)は、適合率と再現率の調和平均のことである。(エ)は、陽性データの中で、正しく陽性と判断できた割合のことである。

    2. 適合率

  • 16

    (イ)に最もよく当てはまる選択肢を選んでください。 ROC曲線は、(ア)と(イ)の関係を表した曲線のことである。縦軸を(ア)、横軸を(イ)をとる。

    1.偽陽性率

  • 17

    (ア)に最もよく当てはまる選択肢を選んでください。 求めたい変数を1つ以上の変数を使って予測する手法を線形回帰分析という。線形回帰において、原因となる変数を(ア)、結果となる変数を(イ)という。また、回帰分析のうち(ア)が1つの分析を(ウ)、(ア)が複数の分析を(エ)という。

    2.説明変数

  • 18

    (イ)に最もよく当てはまる選択肢を選んでください。 求めたい変数を1つ以上の変数を使って予測する手法を線形回帰分析という。線形回帰において、原因となる変数を(ア)、結果となる変数を(イ)という。また、回帰分析のうち(ア)が1つの分析を(ウ)、(ア)が複数の分析を(エ)という。

    4.目的変数

  • 19

    (ウ)に最もよく当てはまる選択肢を選んでください。 求めたい変数を1つ以上の変数を使って予測する手法を線形回帰分析という。線形回帰において、原因となる変数を(ア)、結果となる変数を(イ)という。また、回帰分析のうち(ア)が1つの分析を(ウ)、(ア)が複数の分析を(エ)という。

    1.単回帰分析

  • 20

    (エ)に最もよく当てはまる選択肢を選んでください。 求めたい変数を1つ以上の変数を使って予測する手法を線形回帰分析という。線形回帰において、原因となる変数を(ア)、結果となる変数を(イ)という。また、回帰分析のうち(ア)が1つの分析を(ウ)、(ア)が複数の分析を(エ)という。

    3.重回帰分析

  • 21

    (ア)に最もよく当てはまる選択肢を選んでください。 訓練データ・検証データにテストデータにすべき未知のデータが入ってしまうことを(ア)という。

    2.データリーケージ

  • 22

    (ア)に最もよく当てはまる選択肢を選んでください。 教師あり学習の代表的な手法として、サポートベクターマシン(SVM)がある。サポートベクターマシン(SVM)は、(ア)という考え方を用いて分類を行う線を求めている。また、直線で分類できない場合、次元を拡張させることで分類する方法がある。次元を拡張させる関数を(イ)といい、(ウ)という方法を使うことで計算を楽にすることができる。

    3.マージン最大化

  • 23

    (イ)に最もよく当てはまる選択肢を選んでください。 教師あり学習の代表的な手法として、サポートベクターマシン(SVM)がある。サポートベクターマシン(SVM)は、(ア)という考え方を用いて分類を行う線を求めている。また、直線で分類できない場合、次元を拡張させることで分類する方法がある。次元を拡張させる関数を(イ)といい、(ウ)という方法を使うことで計算を楽にすることができる。

    3.カーネル関数

  • 24

    (ウ)に最もよく当てはまる選択肢を選んでください。 教師あり学習の代表的な手法として、サポートベクターマシン(SVM)がある。サポートベクターマシン(SVM)は、(ア)という考え方を用いて分類を行う線を求めている。また、直線で分類できない場合、次元を拡張させることで分類する方法がある。次元を拡張させる関数を(イ)といい、(ウ)という方法を使うことで計算を楽にすることができる。

    2.カーネルトリック

  • 25

    (ア)に最もよく当てはまる選択肢を選んでください。 状態が遷移するとき、過去の状態に依存しない特性を(ア)という。また、(ア)を満たす遷移過程モデルを(イ)という。

    1.マルコフ性

  • 26

    (ア)に最もよく当てはまる選択肢を選んでください。 ROC曲線よりも下の面積のことを(ア)という。面積が(イ)に近いほどモデルの性能は高いとされる。

    1.AUC

  • 27

    (イ)に最もよく当てはまる選択肢を選んでください。 ROC曲線よりも下の面積のことを(ア)という。面積が(イ)に近いほどモデルの性能は高いとされる。

    4. 1

  • 28

    ホールドアウト検証では、訓練データの一部を(ア)に分割する場合がある。また、(ア)は最終的なパラメータの調整のために使用される。

    4.検証データ

  • 29

    (ア)に最もよく当てはまる選択肢を選んでください。 行動を決めるアクターと価値を評価するクリティックで構成されている強化学習の手法を(ア)という。(ア)は、価値ベースと方策ベースの考え方を組み合わせた手法である。(ア)を応用した手法に(イ)がある。

    4. Actor-Critic

  • 30

    (イ)に最もよく当てはまる選択肢を選んでください。 行動を決めるアクターと価値を評価するクリティックで構成されている強化学習の手法を(ア)という。(ア)は、価値ベースと方策ベースの考え方を組み合わせた手法である。(ア)を応用した手法に(イ)がある。

    1. A3C

  • 31

    t-SNE法における「t」は(ア)を意味する。

    4. t分布

  • 32

    訓練データを学習しすぎた結果、未知のデータに対する精度が悪くなってしまう現象のことを(ア)という。

    2. 過学習

  • 33

    (ア)に最もよく当てはまる選択肢を選んでください。 訓練データに対する予測と正解の誤差を(ア)、未知データに対する予測と正解の誤差を(イ)という。

    4 訓練誤差

  • 34

    (イ)に最もよく当てはまる選択肢を選んでください。 訓練データに対する予測と正解の誤差を(ア)、未知データに対する予測と正解の誤差を(イ)という。

    2. 訓練誤差

  • 35

    自己回帰モデル(ARモデル)の説明として正しい選択肢を選んでください。

    ある時刻の値を、ある時刻よりも過去のデータを使って予測するモデルのこと

  • 36

    (ア)に最もよく当てはまる選択肢を選んでください。 分類モデルの評価について、代表的な指標として(ア)、(イ)、(ウ)、(エ)がある。(ア)は、陽性と判断したデータのうち実際に陽性だった割合のことである。(イ)は、全データのうち正しく予測できた割合のことである。(ウ)は、適合率と再現率の調和平均のことである。(エ)は、陽性データの中で、正しく陽性と判断できた割合のことである。

    2. 適合率

  • 37

    (イ)に最もよく当てはまる選択肢を選んでください。 分類モデルの評価について、代表的な指標として(ア)、(イ)、(ウ)、(エ)がある。(ア)は、陽性と判断したデータのうち実際に陽性だった割合のことである。(イ)は、全データのうち正しく予測できた割合のことである。(ウ)は、適合率と再現率の調和平均のことである。(エ)は、陽性データの中で、正しく陽性と判断できた割合のことである。

    1. 正解率

  • 38

    (ウ)に最もよく当てはまる選択肢を選んでください。 分類モデルの評価について、代表的な指標として(ア)、(イ)、(ウ)、(エ)がある。(ア)は、陽性と判断したデータのうち実際に陽性だった割合のことである。(イ)は、全データのうち正しく予測できた割合のことである。(ウ)は、適合率と再現率の調和平均のことである。(エ)は、陽性データの中で、正しく陽性と判断できた割合のことである。

    4. F値

  • 39

    (エ)に最もよく当てはまる選択肢を選んでください。 分類モデルの評価について、代表的な指標として(ア)、(イ)、(ウ)、(エ)がある。(ア)は、陽性と判断したデータのうち実際に陽性だった割合のことである。(イ)は、全データのうち正しく予測できた割合のことである。(ウ)は、適合率と再現率の調和平均のことである。(エ)は、陽性データの中で、正しく陽性と判断できた割合のことである。

    3. 再現率

  • 40

    (ア)に最もよく当てはまる選択肢を選んでください。 訓練データに対する予測と正解の誤差を(ア)、未知データに対する予測と正解の誤差を(イ)という

    4. 訓練誤差

  • 41

    (イ)に最もよく当てはまる選択肢を選んでください。 訓練データに対する予測と正解の誤差を(ア)、未知データに対する予測と正解の誤差を(イ)という

    2. 汎化誤差

  • 42

    (イ)に最もよく当てはまる選択肢を選んでください。 訓練データに対する予測と正解の誤差を(ア)、未知データに対する予測と正解の誤差を(イ)という

    2. 汎化誤差

  • 43

    (ア)に最もよく当てはまる選択肢を選んでください。 決定木において、分岐路を作るとき、(ア)が最大化するように分岐路を作っていく。(ア)は、分割前の(イ)から分割後の(イ)を引いたものである。(イ)の指標として(ウ)などがある

    1. 情報利得

  • 44

    (イ)に最もよく当てはまる選択肢を選んでください。 決定木において、分岐路を作るとき、(ア)が最大化するように分岐路を作っていく。(ア)は、分割前の(イ)から分割後の(イ)を引いたものである。(イ)の指標として(ウ)などがある

    4. 不純度

  • 45

    (ウ)に最もよく当てはまる選択肢を選んでください。 決定木において、分岐路を作るとき、(ア)が最大化するように分岐路を作っていく。(ア)は、分割前の(イ)から分割後の(イ)を引いたものである。(イ)の指標として(ウ)などがある

    3. エントロピー

  • 46

    (ア)に最もよく当てはまる選択肢を選んでください。 教師あり学習は、(ア)や(イ)を解くときによく使われる手法である。(ア)は複数のカテゴリに分ける問題であり、(イ)は連続値を予測する問題である。

    1. 分類問題

  • 47

    (ィ)に最もよく当てはまる選択肢を選んでください。 強化学習において、最適な(ア)を見つけることは重要だが、見つけ出すことは難しい。しかし、最適な(ア)を見つけ出すために、様々な研究が行われている。例えば、(ア)をパラメータのもった関数と定義して(ア)の価値が最大になるようにパラメータを学習させていくことで、最適な(ア)を見つけ出そうとする(イ)などがある

    2.方策勾配法

  • 48

    正則化の説明として、最もよく当てはまる選択肢を選んでください。

    パラメータ(重み)に制限をかけることで、複雑になりすぎたモデルをシンプルなモデルにしていくこと

  • 49

    (ィ)に最もよく当てはまる選択肢を選んでください。 強化学習において、最適な(ア)を見つけることは重要だが、見つけ出すことは難しい。しかし、最適な(ア)を見つけ出すために、様々な研究が行われている。例えば、(ア)をパラメータのもった関数と定義して(ア)の価値が最大になるようにパラメータを学習させていくことで、最適な(ア)を見つけ出そうとする(イ)などがある

    2.方策

  • 50

    (イ)に最もよく当てはまる選択肢を選んでください。 教師あり学習は、(ア)や(イ)を解くときによく使われる手法である。(ア)は複数のカテゴリに分ける問題であり、(イ)は連続値を予測する問題である。

    4.回帰問題

  • 51

    (ア)に最もよく当てはまる選択肢を選んでください。 強化学習とは、与えられた環境下で、(ア)が最大化する行動を学んでいくことである。また、エージェントの行動基準のことを(イ)という。

    1.報酬

  • 52

    (ィ)に最もよく当てはまる選択肢を選んでください。 強化学習とは、与えられた環境下で、(ア)が最大化する行動を学んでいくことである。また、エージェントの行動基準のことを(イ)という。 全体的な説明

    3.方策

  • 53

    教師あり学習の分類問題に関する例として、最も適切な選択肢を選択してください。

    4. 顧客の商品購入履歴から、ある商品を購入するかどうかを予測する

  • 54

    (ア)に最もよく当てはまる選択肢を選んでください。 ブースティングの代表的な手法に、(ア)や(イ)などがある。(ア)はモデルの最適化に勾配降下法を使用する手法であり、(イ)はYoav FreundとRobert Schapireによって考案された手法である。

    3.勾配ブースティング

  • 55

    (ィ)に最もよく当てはまる選択肢を選んでください。 ブースティングの代表的な手法に、(ア)や(イ)などがある。(ア)はモデルの最適化に勾配降下法を使用する手法であり、(イ)はYoav FreundとRobert Schapireによって考案された手法である。

    2.AdaBoost

  • 56

    (ア)に最もよく当てはまる選択肢を選んでください。 Q学習やSARSAは、(ア)の1種である。

    2.TD学習

  • 57

    階層クラスター分析において、クラスタ間の距離を測定する方法は複数存在する。例えば、ウォード法や(ア)などがある。

    3.群平均法

  • 58

    半教師あり学習に関する説明として、最も不適切な選択肢を選択してください。

    1.正解ラベル付きのデータは必要でない

  • 59

    自己回帰モデルを多変量に拡張したモデルを(ア)という。

    1.VARモデル

  • 60

    (ア)に最もよく当てはまる選択肢を選んでください。 アンサンブル学習には、一部のデータを抽出し、モデルを直列的に学習させていく(ア)や複数のモデルを並列的に学習させていく(イ)などがある。

    3.ブースティング

  • 61

    (ィ)に最もよく当てはまる選択肢を選んでください。 アンサンブル学習には、一部のデータを抽出し、モデルを直列的に学習させていく(ア)や複数のモデルを並列的に学習させていく(イ)などがある。

    1.バギング

  • 62

    教師あり学習の回帰問題に関する例として、最も適切な選択肢を選択してください。 全体的な説明

    2.気温、曜日などの情報から1日あたりのA店舗の売上を予測した

  • 63

    (ア)に最もよく当てはまる選択肢を選んでください。 正則化を行いすぎると(ア)になってしまう危険性があるので注意する必要がある。

    2.未学習

  • 64

    (ア)に最もよく当てはまる選択肢を選んでください。 強化学習における価値反復法では、状態価値を(ア)で初期化し、状態価値を更新していく。

    2. 0

  • 65

    回帰モデルの精度の評価指標に関する説明として、最も不適切な選択肢を選択してください。

    2. MAEはRMSEに比べて外れ値から大きな影響を受けてしまう

  • 66

    (ア)に最もよく当てはまる選択肢を選んでください。 k近傍法では、k=(ア)のとき、外れ値の影響を受けてしまい、予測精度が低下してしまう。

    1. 1

  • 67

    k近傍法の特徴の説明として、正しい選択肢を選択してください。

    1.クラスごとのデータ量に偏りがある場合、性能が低くなる可能性がある

  • 68

    (ア)に最もよく当てはまる選択肢を選んでください。 各データが1つのクラスタに所属するようにクラスタリングを行うことを(ア)という。一方、各データが1つ以上のクラスタに所属することを許すクラスタリングを(イ)という。

    1. ハードクラスタリング

  • 69

    (ィ)に最もよく当てはまる選択肢を選んでください。 各データが1つのクラスタに所属するようにクラスタリングを行うことを(ア)という。一方、各データが1つ以上のクラスタに所属することを許すクラスタリングを(イ)という。

    3.ソフトクラスタリング