問題一覧
1
多変量解析の主要な分析手法(タスク)として正しいものを全て選択せよ.
クラスタリング(グループ化、分類とも言う), 回帰, 次元削除(因子分析・主成分分析など), 判別
2
DIKWピラミッドの要素に含まれないものをひとつ選択せよ。
変数
3
授業内での説明をもとに、次の文章のカッコ内に当てはまる言葉として最も適切な比喩的表現を選択せよ。 「環境統計解析学応用」では、多変量解析手法の( )を目指す。
"安全運転"
4
「環境統計解析学応用」の履修を通じて、みなさんが獲得を目指すこととして正しいものを全て選択せよ。
自分の力で課題・目的を設定できる, たくさんの方法(アルゴリズム)の中から適切なものを選びとって使える, 正しく手法を適用(実践)できる
5
以下は「情報」と「データ」の違いを説明する文章である。カッコないに当てはまる言葉として適切なものを選択せよ。 データは事実や観測値を表現した単なる( )だが、情報はデータを処理・整理して解釈可能な状態にしたものであり知識の獲得に役立つ。
記録
6
次のうち、〇〇に当てはまる最も適切な言葉を選択せよ。 「〇〇〇〇とは、ある事象(原因)が他の事象(結果)に与える影響の強さや程度のことである。」
因果効果
7
ある小学校で靴のサイズと計算テストの点数とを比較したところ、靴のサイズが大きい人ほど計算テストの結果が良いという関係が見られた。このような関係を「因果関係」と呼ぶことができるか。
「因果関係」と呼ぶことができない
8
次のような問題を何と呼ぶか適切なものを一つ選択せよ。 「特定の個人などに対するトリートメント(介入)の結果について、事実と反事実の両方を把握することはできない。そのため、トリートメントの因果効果の推定値を得ることができない。」
因果推論の根本問題
9
「ランダム」の意味として適切なものをひとつ選択せよ。
特定のパターンや規則に従わないこと
10
次のうち正しいものを一つ選択せよ。
多変量解析は事象の背後にある因果関係の解釈に重要な役割を果たす。
11
次のうち正しいものを全て選択せよ。
アルゴリズムとは、ある特定の問題を解決するための手順やルールのことである。, AIとは、人間の知的な行動や思考を模倣支持率的にタスクを推敲するコンピュータシステムのことである。, AIが知識を学び、問題を解決し、予測を行うためには、アルゴリズムが不可欠である。, AIが行うすべての処理や決定は、何らかのアルゴリズムに基づいて行われている。
12
〇〇にあてはまる最も適切な言葉を選択せよ。 「アルゴリズムは、〇〇を用いて似ている似ていないの判断を行う。」
距離
13
データをいくつかのグループに分けるための分析手段を何と呼ぶか。正しいものをひとつ選択せよ。
クラスター分析
14
次のうち、最も一般的な距離である「直感距離」の別名を選択せよ。
ユークリッド距離
15
〇〇にあてはまる最も適切な言葉を選択せよ。 「多変量解析における〇〇とは、データセット内で分析される変数(特徴量など呼び方はいろいろ)の数のことである」
次元
16
非階層的クラスタリングの説明として間違っているものを一つ選択せよ。
段階的に統合または分割
17
非階層的クラスタリングの応用例として適切でないものをひとつ選択せよ。
迷惑メールの特定
18
k-meansは最も一般的な非階層的クラスタリングの手法である。k-meansの短所と考えられることを全て選択せよ。
クラスタの数(k)を事前に指定する必要がある, 球状のクラスタしか適切に分けられない, 外れ値に弱い, 局所解に収束する可能性がある
19
DBSCANは、不規則な形状のクラスタを特定をできるという優れた特性を持つアルゴリズムだが、事前のパラメータ設定が難しい。 以下の中から、DBSCANにおいて設定が必要な2つのパラメータを選択せよ。
1つのクラスタを形成するために必要な最小のデータ点の数, クラスタの範囲を決める半径
20
次の文章の〇〇〇に当てはまる言葉として適切なものを選択せよ。 「k-meansは距離に基づくアルゴリズムなので、データの〇〇〇が重要となる。〇〇〇には、標準化(Zスコア変換)や最小-最大スケーリングなどの方法がある。」
スケーリング