問題一覧
1
各変数における係数の推定値のこと
偏回帰係数
2
目的変数の実測値と目的変数の推定値との間の相関係数のこと
重相関係数
3
数値で表現されたデータに変換する際に最もよく用いられる方法
ワンホットエンコーディング
4
モデルの予測値と実際のデータの差の絶対値の平均
MAE
5
MAEの特徴は?
外れ値の影響を受けにくい
6
残差の二乗の平均のこと
MSE
7
入力データを元にそのデータが陽性である確信度を確率値(0-1)で出力する方法
ロジスティック回帰
8
しきい値に依存しない評価指標で 原点と(1.0,1.0)を通る曲線
ROC曲線
9
ラベル付け作業のこと
アノテーション
10
クラスタの中心点をランダムにk個配置し、中心点と各データの距離の総和が最小になるように中心点を更新する方法
k-means法
11
量的変数→カテゴリを表す質的変数に変換
カテゴライズ
12
量的変数を等間隔の区間で分割
ビン化
13
同一条件下において得られた測定値を平均した値
アンサンブル平均
14
効率の良い実験方法を設計し、結果を適切に解析することを目的とする統計学手法
実験計画法
15
マージン最大化に基づいて分類の境界線を学習する手法
サポートベクターマシン
16
文を単語に分割し、各形態素の属性を判定
形態素解析
17
自然言語処理において、用いられる複数の言語理解タスクを一つにまとめたベンチマーク
GLUE
18
非圧縮フォーマットの音声データ
WAV
19
データ圧縮技術
コーデック
20
圧縮前のデータを完全復元可能な音声データのコーデック
FLAC
21
圧縮前のデータを完全復元は不可能な音声データのコーデック
MP3
22
windowsにおける標準的な動画フォーマット
AVI
23
macOSにおける標準的な動画フォーマット
MOV
24
Google社によって開発・公開されているweb向けな軽量な動画フォーマット
WebM
25
本来、映像や音声を扱うための形式 音声の格納も可能
MP4
26
小売店や通販サイトにおける顧客の買い物かごの中身の傾向を解析
バスケット分析
27
バスケット分析において、 P(A^B)
支持度
28
複数のモデルの予測結果を組み合わせることで汎化性能の高いモデルを生成する手法
アンサンブル学習
29
保存を繰り返しても画質が劣化しない
PNG形式
30
目視では把握できない情報を削除することでデータを圧縮 保存を繰り返すたびに画質は劣化
JPG形式
31
画像の縁にダミーのデータを挿入する処理
パディング
32
各モデルを並列的に学習する手法
パギング
33
各モデルを直列的・逐次的に学習させる手法
ブースティング
34
プログラムツールを用いてWebサイトからデータを取得すること
ウェブスクレイピング
35
プログラムがインターネット上のリンクを辿ってwebサイトを巡回し、webページ上の情報を収集する技術
ウェブクローリング
36
webクロージングを行うプログラム
ウェブクローラ
37
プログラム同士で通信を行うための仕組み
API
38
XMLフォーマットで通信を行うプロトコルを定義したもの
SOAP
39
日本語で「関係データベース」
RDB
40
RDBのテーブル間の複雑な関係性を分かりやすく可視化する図
ER図
41
データのまとまり
エンティティ
42
エンティティの各要素
アトリビュート
43
エンティティ間の関係性を示す線
リレーション
44
リレーションの始点と終点を一定の記号で表現
カーディナリティ
45
ネットワークを介してデータをやりとりするための手順
FTP
46
転送するファイルをSSHで、暗号化する方式を採用
SCP
47
暗号化されていない状態でやりとりされる HTMLなどの情報をやり取りする際に使われる通信プロトコル
HTTP
48
HTTPSとは⚪︎⚪︎を利用してデータを暗号化している HTTPと同じ通信方式
TLS
49
統計解析を目的として利用するプログラミング言語
R
50
非プログラミング言語で、データ分析を容易にするBIツールの一種 画面上で感覚的に操作可能なデータ分析ソフトウェア
Tableau
51
様々な種類のデータベースに接続しているGUIを介したデータ操作を可能にするツール
DBeaver
52
大規模データを効率的に分散処理・管理するためのソフトウェア基盤の一つ
Apache Hadoop
53
分散保存されたデータを収集し、計算などの処理を施すためのフレームワーク
MapReduce
54
ビッグデータや機械学習など大規模なデータを扱うクラスターコンピューティング向け分散処理フレームワーク
Spark
55
セキリュティ3要素を答えよ
機密性, 完全性, 可用性
56
アクセス制御を実現するための3要素
認証, 認可, 監査
57
コンテナ型の仮想化を実装するソフトウェア
Docker
58
スキルセットの異なる機械学習エンジニアと実運用者を効率的につなぐための考え方
MLOps
59
購入までのプロセスを認知、関心、欲求、記憶、行動の5つに分類し、消費者の行動を細分化する
AIDMA
60
ビジネスにおけるステークホルダーを全て列挙し、製品、金銭、情報の流れを明確にする手法
CVCA
61
物事の構成要素を考える際、列挙する要素に漏れや重複が発生しないようにするフレームワーク
MECE
62
「目標と主な結果」という意味をもつ目標管理の指標
OKR
63
目標を達成するための指標
SMART
64
主要な成功要因
CSF
65
一定の条件を満たした場合に、本人の許可を得ていなくとも第三者に個人情報を提供可能なこと
オプトアウト
66
他の情報と照合しない限り特定の個人を識別することができないように個人情報を加工した情報
仮名加工情報
67
EU域内の個人データ保護を規定する法律
GDPR
68
消費者プライバシーについて規定した米国の個人情報保護法
CCPA
69
CCPAの改正案
CPRA
70
入力された文が英文法的に正しいかを判定する
CoLA
71
入力された文(映画レビュー)を分類する(評判がポジティブかネガティブかを判定する)
SST-2
72
入力された2つの文の意味が同じかどうかを判定する
MRPC
73
入力された2つの文の意味の類似性を評価する
STS
74
入力された2つの質問文の意味が同じかどうかを判定する
QQP
75
入力された2つの文の含意関係(含意・矛盾・中立)を判定する
MNLI
76
あるパラグラフとそれに対する質問が入力され、パラグラフが質問に対する正しい回答を含んでいるか否かを判定する
QNLI
77
入力された2つの文の含意関係を判定する
RTE
78
ある代名詞が文中のどの名詞を指しているのかを判定する
WNLI
79
モデルの訓練誤差が十分小さいにもかかわらず、汎化誤差が大きいこと
過学習
80
機械学習において、説明変数の数が増えると、学習の難しさが指数的に増加する現象
次元の呪い
81
2つの結果しか生じないような試行のこと
ベルヌーイ試行
82
通し番号をつけた名簿を作成して、1番目の調査対象を無作為に選び、2番目以降の調査対象を一定間隔で抽出する方法
系統抽出法
83
母集団をいくつかのグループに分け、そこから無作為抽出でいくつかのグループを選ぶ操作を繰り返して、最終的に選ばれたグループの中から調査対象を無作為に抽出する方法
多段抽出法
84
母集団を小集団である「クラスタ」に分け、分けられたクラスタの中きらいくつかのクラスタを無作為に抽出し、それぞれのクラスタ内全ての個体を調査する方法
集落抽出法
85
母集団をあらかじめいくつかの層に分けておき、各層の中から必要な数の調査対象を無作為に抽出する方法
層別抽出法
86
データの個々の要素を1つのクラスタとして扱い、距離の近いクラスタ同士を結合する手法
階層型クラスタリング
87
オートエンコーダというネットワークを確率モデル化し、未知のデータを確率的に作成できるようにしたもの
VAE
88
しきい値に依存しない評価指標として (0.5〜1までの値をとる曲線
AUC
89
階層型クラスタリングの結果は⚪︎⚪︎という図で表される
デンドログラム
90
機械学習において、 ある入力データに対して、適切な連続値を出力すること
回帰
91
機械学習において、 ある入力データに対し、適切なカテゴリ(病気である/病気でないなど)を出力すること
分類
92
自然言語処理において、 出現頻度の少ない単語や、タスクに関係のない単語
ストップワード
93
自然言語処理において、 単語の語幹を抽出する処理
ステミング
94
ニューラルネットワークが多層化しすぎると学習が思うように進まなくなる現象
勾配消失
95
オープンソースのRDBMの一つ さまざまな OSに対応しており、小規模なシステムから大規模なものまで対応できるといった長所がある
MySQL
96
オープンソースのRDBMの一つ カリフォルニア大学バークレー校のコンピュータサイエンス学部で開発開始
PostgreSQL
97
サーバとして利用するのではなく、アプリケーションに組み込んで利用するRDBM
SQLite
98
重要目標達成指標のこと
KGI
99
IoTをコアとして現実空間と仮想空間ご相互連関し、より高度な社会を実現していく仕組み
CPS
100
独自に収集したデータ
一次データ