問題一覧
1
組み合わせ
b. 異なるものの中から任意の要素を組み合わせた場合 の数
2
対称差集合
c. 2つの集合のどちらか一方にのみ属する要素の集合
3
条件付き確率
a. ある事象Aが起こったという条件下で、ある事象日 が起こる確率
4
代表値
c. あるデータ群の特性を1つの数値で表すような値
5
分散
b. それぞれのデータに対して、全データの平均との差の 2乗値を計算し、その総和をデータ数で割った数値
6
標準偏差
a. 分散の正の平方根をとった値
7
母集団
a. 調査対象となるデータ全体を指す
8
正規分布
b. 平均を中心として、平均に近いほど出現頻度が高く、 平均から離れるほど出現頻度が低くなっていく確率 分布
9
名義尺度
a. 区別のために数字を付けた質的データの尺度
10
比例尺度
C.原点を持つ量的データの尺度
11
相関係数
b. 単位の影響を受けずにデータの関係性を比較するこ とができる
12
ピアソンの相関係数
c. 2種類のデータが連続性と正規分布をとる際に用い られる相関係数
13
単調関係
b.一方の変数が増加すると、もう一方の変数が増加ま たは減少する関係
14
常用対数
a. 10 を底とする対数
15
離散型確率分布
a. 確率変数が不連続な値となる確率分布
16
ベイヌーイ分布
c.結果が2通りの試行を1回だけ行うときに得られる分布
17
二項分布
b.2通りの結果を得る試行を何度も行った場合に得ら れる事象の分布
18
事後確率
c. P(B|A)
19
ベクトル
b. 複数の数値を一列に並べたもの
20
固有ベクトル
a. 線形変換を行っても向きが変わらないベクトル
21
導関数
b. ある関数に対して微分をした結果を求める関数
22
不定積分
c. 微分をすると対象の関数になるような関数を求める
23
確率密度関数
a. 連続して変化する値に対する確率がどのような分布 になるかを表現する
24
偏微分
a. 複数の変数を持つ関数に対する微分
25
層化
a. 離散化などによりグループ分けし分類すること
26
アンサンブル平均
c. 同じ条件下でのデータの値の集合的な平均
27
ヒストグラム
b. ある基準に沿ってグループ分けし、各グループに含 まれるデータの数を表したもの
28
標本誤差
a. 一部の標本を抽出して調査した結果にともなう誤差
29
アウトカム
b. 出力結果がもたらした効果や影響
30
欠測データバイアス
a. 必要なデータの一部が欠けている場合に起こるバイ アス
31
ダミー変数
c. 0と1に変換した変数
32
欠損値
c. 何らかの原因で存在しない値
33
インフォデミック
c. 真偽のわからない情報が大量に拡散され、社会的な 混乱を招く現象
34
(アソシエーション分析の)信頼度
a. 事象が起こった状況下で、事象Yも起こる割合
35
教師あり学習
b. データと正解をセットにしたデータセットを用いて 機械学習をする方法
36
最小二乗法
b. 予測値と実測値の誤差の2乗の和を最小にする手法
37
重回帰分析
b. 複数の説明変数で目的変数を予測すること
38
シグモイド関数
a. 入力値を0~1の範囲の数値に変換して出力する関 数
39
アンサンブル学習
c.弱学習器を多数用いて学習する手法
40
ニューラルネットワーク
c. 3種類の層により人間の脳の神経回路網を表現した アルゴリズム
41
勾配消失問題
a. ニューラルネットワークのパラメータ更新時に使用 する勾配が本来の値より小さくなる事象
42
深層学習(ディープラーニング)
a. ニューラルネットワークの中間層を多層にして学習 する手法
43
GPT-3
c. 人間が作成したような自然な文章を生成することが できるモデル
44
デンドログラム
a. 逐次的にデータがグルーピングされる様子を樹木の ような形で表した図
45
k-means法(k平均法)
a. 類似度の高いもの同士を集め、階層的な構造を持た ずにクラスターを作る手法 l
46
過学習
c. モデルが学習データに対してのみ最適化される事象
47
次元の呪い
b. モデルに与えるデータの次元数を増やし過ぎることで、汎化性能が低下する事象
48
データドリフト
b. モデルの学習時に使用したデータとビジネスで発生 するデータの傾向に差異が生じる事象
49
ML Ops
c. 機械学習、開発、運用のそれぞれのチームが協調し 合うことで、モデルの開発から運用までのライフサ イクルを円滑に進めるための管理体制を築くこと
50
汎化性能
a. 未知のデータに対する予測精度
51
RMSE
a. 平均二乗誤差に対して平方根を求めた指標値
52
MAPE
c. 「予測値と実測値の差」の確率値 (パーセント誤差) を平均した指標值
53
AUC
b. ROC曲線の内側の面積のこと
54
帰無仮説
c. 母集団に関して否定したい仮説
55
対応のないデータ
a. 測定対象が異なるデータ
56
スチューデントt検定
c. 母分散が等しいときの対応のないデータにおける 2標本の検定手法
57
トレンド
a. 時系列データにおいて、長期にわたって持続的に変 化する傾向のこと
58
GLUE
b. 自然言語処理モデルの精度を評価するための評価基 準
59
ジャギー
a.画像内に現れる階段状のギザギザのこと
60
量子化ビット数
b. 音声信号を何段階で調整するかを表す数値
61
ホットスタンバイ
c.本番機と同期する予備機を用意し、障害が発生した場 合に即座に予備機に切り替えられるようにする構成
62
コンテナ型仮想化
c. 他のプロセスから隔離されている独立した領域を サーバーのように運用する仮想化方式
63
API
a. 外部ソフトウェアが持っている機能をアプリケーション内で利用できる仕組み
64
Webクローラー・スクレイピング ツール
b. Web ページの情報から特定の情報を取得するプログラム
65
FTP
c. ファイルの送受信をするための通信プロトコル
66
構造化データ
b. 「列」と「行」の形式で表すことができるデータ
67
ER図
a. リレーショナルデータベースの設計図
68
データベース化
c. データの重複を防ぎ、整合的にデータを取り扱える ようにデータベースを設計する手法
69
(SQL)ORDER BY
a. データ抽出時にソート処理を行う
70
(SQL)INNER JOIN
b. データ抽出時にテーブル同士を内部結合する
71
マッピング処理
a. データ処理において、ある値を別の値と対応付けす る処理のこと
72
外部参照制約
b. 他のテーブルのカラムを参照し、そのカラムに登録 されていないデータの挿入を禁止する制約
73
フローチャート
c.目的を実現するための手順 (アルゴリズム)を図示し たもの
74
システム CPU 時間
c. OSが使用している CPU 時間
75
JSON
b. JavaScript の記法で記述するデータフォーマット
76
Jupyter Notebook
a. Python などのプログラムの実行や実行結果の保存が できるツール
77
境界値分析
c. 入力値を有効値と無効値に分割し、それぞれの境界 値を使用して入力チェックを行う方法
78
セキュリティの3要素
a. 機密性、完全性、可用性
79
トロイの木馬
c . 無害なソフトウェアに偽装してコンピュータに侵入 するマルウェア
80
OAuth
b. 異なる Web サービス間でアクセスの認可を行うた めの標準仕様
81
公開鍵暗号方式
b. 暗号鍵と復号鍵が別々である暗号化方式
82
ハッシュ関数
a. 文字列を特定のルールで別の数値文字列に変換する 関数
83
電子署名
c. データが送信者本人によって作成されたものであり、 改ざんされていないことを証明できる仕組み
84
KGI
a. 事業で達成したい目標を明確にしたもの
85
メタ認知思考
c. 自分自身の考えや行動を客観的に見ることで、本質 的な課題に気付き、解決できる能力
86
一次情報
a. 自身で直接取得した情報
87
FFP
c. 代表的な3つの不正行為の頭文字を取ったもの
88
ディープフェイク
b.2つの画像や動画の一部を結合させることで、実際 には存在しない画像や動画を作る技術
89
ELSI
b.倫理的、法的,社会的課題の総称
90
GDPR
a. EU域内における個人情報の取り扱いについて定めた 規則
91
要配慮個人情報
c. 不当な差別、偏見、その他の不利益が生じないよう に取り扱いに配慮が必要な情報
92
準委任契約
c. 当事者の一方が法律行為ではない事務を相手方に委 託し、相手方がこれを承諾することによって成立する契約
93
MECE
a. 漏れや重複がない状態を指す言葉
94
ストーリーライン
b. 結論に至るまでの説明の流れを指す言葉
95
スコーピング
a. 対象のビジネスや事業を監視し、有効なアクション を検討するための評価・改善活動
96
5フォース分析
a. 業界の競争状況を把握するためのフレームワーク
97
ガントチャート
b. プロジェクトの進行状況を視覚的に表現するグラフ
98
SLA
a. サービスの品質を保証する契約書
99
Society 5.0
c. 仮想空間と現実空間が融合する社会