暗記メーカー
ログイン
データサイエンテストその2
  • gko tis

  • 問題数 100 • 11/14/2024

    記憶度

    完璧

    15

    覚えた

    35

    うろ覚え

    0

    苦手

    0

    未解答

    0

    アカウント登録して、解答結果を保存しよう

    問題一覧

  • 1

    公開/販売されているような自ら収集したものではないデータ

    二次データ

  • 2

    帰無仮説が真なのに、偽であるとして棄却してしまうこと

    第一種の過誤

  • 3

    帰無仮説が偽なのに、真であるとして棄却しないこと

    第二種の過誤

  • 4

    データを事前に学習用と検証用に分割し、検証用データで学習済みモデルの汎化誤差を評価する方法

    ホールドアウト法

  • 5

    データを複数のグループに分け、学習用と検証用を交代させながら、汎化誤差を評価する手法

    交差検証法

  • 6

    WEBテキストから辞書情報を自動獲得できる点とウェキペディアから抽出した辞書も利用できる点が特徴 形態素解析ツールのルーツ

    ChaSen

  • 7

    日本語の解析ツールで、AIなどが日本語などの言語を機械的に処理するために使う

    MeCab

  • 8

    MeCabの解析結果を入力する係り受け解析ツール

    CaboCha

  • 9

    画像のぼかしや平滑化に利用される処理

    ガウシアンフィルター

  • 10

    画像を周波数領域に変換する手法

    フーリエ変換

  • 11

    画像中の形状や構造を変更するために使用

    モルフォロジー変換

  • 12

    特定の条件を満たした際にコンピュータを攻撃するもの

    ロジックボム

  • 13

    無害なファイルを装って侵入し、コンピュータに損害を与えるもの

    トロイの木馬

  • 14

    プログラムに寄生せず、単独で存在し、自己増殖をしていくマルウェア

    ワーム

  • 15

    データをそのままの形で蓄積できる場所

    データレイク

  • 16

    機械学習において、学習データを水増しする手法

    データオーギュメンテーション

  • 17

    分析しやすい形に整形されたデータを蓄積する場所

    データウェハウス

  • 18

    特定の利用目的のために抽出されたデータを蓄積する場所

    データマート

  • 19

    異なる場所に存在するデータに対して、同じものを指している要素同士を関連づける処理

    マッピング処理

  • 20

    画像のどの画素がどの物体のクラスに属しているか出力する

    セマンティックセグメンテーション

  • 21

    テーブルの中から条件に合った行のみを抽出する演算

    選択

  • 22

    テーブルの中から特定の列を抽出する演算

    射影

  • 23

    タブ文字で値を区切るデータ形式

    TSV

  • 24

    空白で値を区切るデータ形式

    SSV

  • 25

    画像内のオブジェクトを背景から切り出す深層学習を用いたセマンティックセグメンテーション

    U-net

  • 26

    開発対象の機能をいくつかの段階に分け、優先度の高い順に反復して開発する

    スクラム

  • 27

    データ同士を無相関化した上で、平均を0、分散を1にする処理

    白色化

  • 28

    新しい科学技術を社会実装する際に生じる可能性のある、倫理的、法的、社会的課題など、技術的課題以外のあらゆる課題を一体的に検討するべきという考え方

    ENSI

  • 29

    グラフに表示される情報を理解するために不要な視覚要素や、この情報から視聴者の注意をそらすような視覚要素

    チャートジャンク

  • 30

    実験計画法において、Fisherの三原則とは

    局所管理化, 反復, 無作為化

  • 31

    レジでバーコードを読み取り商品が売れたときにリアルタイムで蓄積される各種データ

    POS

  • 32

    教師あり学習ではこの2種のデータをコンピュータに入力

    特徴量, 正解データ

  • 33

    予測値と正解値のとのズレの大きさを計算する関数

    損失関数

  • 34

    モデルの複雑さとモデルのデータへの当てはまりの良さのバランスを評価する指標

    赤池情報量基準

  • 35

    ユーザーが設定するパラメータで、モデルの複雑さや学習の進行を制御する

    ハイパーパラメータ

  • 36

    段階状のギザギザ線が現れて、被写体の輪郭がぼやけてしまう

    ジャギー

  • 37

    本来存在しない縞模様が現れる

    エイリアシング

  • 38

    CNNはこの3種類のレイヤーから構成される

    畳み込み層, プーリング層, 全結合層

  • 39

    比較的に汎化性能への寄与度の低いノード間の接続を切る

    プルーニング

  • 40

    大規模モデルへの入力データとその出力を用いて、小さいモデルを学習する

    蒸留

  • 41

    過去の実績値を説明変数として使用

    ラグ特徴量

  • 42

    代名詞などの照応表現が指している場所を推定

    照応解析

  • 43

    全角、半角、大文字と小文字、その他の言葉の揺らぎを統一

    名寄せ

  • 44

    モデルのパラメータ数とそれに伴う訓練データ、計算量などが増加するにつれて、モデルの性能もほぼ同じ割合で向上するという経験則

    スケール則

  • 45

    自然言語処理に用いられる大規模なテキストデータ

    コーパス

  • 46

    全体のコードのうち、テストされたコードの割合

    コードカバレッジ

  • 47

    プロジェクトで達成すべき成果物や目的を明確にするプロセス

    スコーピング

  • 48

    通信を傍受される

    スパイウェア

  • 49

    望まない広告が強制的に表示される

    アドウェア

  • 50

    デバイスへの不正アクセスを可能にされる

    バックドア

  • 51

    推定値のばらつき

    バリアンス

  • 52

    事象や変数の間の関連性を見出すために使用される分析手法

    アソシエーション分析

  • 53

    AIを社会で運用するにあたり、遵守すべき設計思想の三原則

    公平性, 説明責任, 透明性

  • 54

    異なるクラスで同じ名前のメソッドが使える性質

    ポリモーフィズム

  • 55

    デジタル信号の精度を高精度の形式から低精度の形式に下げるプロセス

    量子化

  • 56

    次元削減の一つで 高次元データを低次元空間に圧縮することで、データの構造やパターンを視覚化しやすくする目的で用いられる

    UMAP

  • 57

    産業構造や人口動態などに関するデータを地図上に可視化できるWebサイト

    RESAS

  • 58

    両端にある外れ値を除いたデータで計算した平均値

    トリム平均

  • 59

    サポートベクターマシンにおいて、どの程度データ点がマージン内へ侵入しても良いかを表すパラメータ

    スラック変数

  • 60

    Youtubeやニコニコ動画で使用されるフォーマット

    FIV

  • 61

    用意されたデータから特徴を学習し、擬似的なデータを生成することができる生成モデル

    GAN

  • 62

    複数のWebサービスを連携して動作させるために使われる仕組み

    OAuth

  • 63

    企業や組織がシステム構築などにおいて特定のベンダーだけに依存した結果、そのベンダー以外の製品やサービスへの移行が困難となる状況に陥ること

    ベンダーロックイン

  • 64

    強化学習において、行動主体のこと

    エージェント

  • 65

    エージェントの行動によりなんらかのの影響を受けるもの

    環境

  • 66

    エージェントが行動をすると環境の状態が変化するが、 ある状態から別の状態に変化すること

    遷移

  • 67

    強化学習において、 遷移先の状態が、直前の状態とそこで行った行動にのみ依存するという性質

    マルコフ性

  • 68

    物理学における力学系の運動の長時間平均と位相空間における平均が一致する性質

    エルゴード性

  • 69

    CNNにおいて、 局所領域からフィルタを通して検出する際、物体の位置のズレに頑健になる性質

    移動不変性

  • 70

    入力データの変更のうち、 モデルのパフォーマンスの低下につながるような変更のこと

    データドリフト

  • 71

    隣接するボロノイ領域の母点同士を結んだ図形

    ドロネー図

  • 72

    AIレコメンド機能などにおいて嗜好の分析にもとづくパーソナライズが強すぎることで、特定の分野にばかり注意を向けさせ、特定の団体の存在だけ強調され、 それによって、無意識に我々の意識に偏りをもたらす現象

    フィルターバブル

  • 73

    SNSを利用する際、 自分の意見や関心が似ているユーザーのみフォローすることによって、 SNS上で投稿すると自分と似たような意見ばかり返ってくる現象

    エコーチェンバー

  • 74

    教師あり学習の2種のタスク

    分類問題, 回帰問題

  • 75

    教師なし学習の2種のタスク

    クラスタリング, 次元削減

  • 76

    正解ラベル付きデータを十分に用意できない または 正解ラベルをつけるコストを削減したいときに使うと有利なもの

    半教師あり学習

  • 77

    ノンパラメトリック検定の一つで、 対応のある3群以上のデータの群間に差があるかを調べるときに使う

    Friedman検定

  • 78

    パラメトリック検定の一つで、 3つ以上のデータがある場合、それぞれの平均値の間に有意な差があるのかないのか、 そしてあるとすれば、どの平均値とどの平均値の間に差があるのかを判定する手法

    ANOVA

  • 79

    本籍地、門地、労働組合への加盟の有無といった項目は、 「金融分野における個人情報保護のガイドライン」における⚪︎⚪︎情報

    機微

  • 80

    人種、信条、社会的身分などは⚪︎⚪︎情報

    要配慮個人情報

  • 81

    クラスタ内の複数のノードに配置されたデータ要素の不変の集合体

    RDD

  • 82

    教師なし学習はこの2種のタスクを扱う

    クラスタリング, 次元削減

  • 83

    大量なピクセルの集まりで、 JPGやPNG、GIFは全てこれにあたる

    ビットマップ画像

  • 84

    画像の直線や曲線を数値として演算して、数式で表した画像

    ベクター画像

  • 85

    膨大なデータで訓練した学習済みモデルの汎用的なパラメータ値を別のタスクに応用すること

    転移学習

  • 86

    既存手法よりも人間に近い自然な音声を高速に生成できる音声生成モデル。 音声を多数の点の系列として捉え、1つ1つの点をCNNを用いて生成することで音声波形を形成する

    WaveNet

  • 87

    文章中の単語の重要度を定量化する手法

    TF-IDF

  • 88

    単語の出現頻度に基づいてテキストを数値ベクトルに変換する手法

    BoW

  • 89

    オブジェクト指向の三原則とは?

    継承, カプセル化, ポリモーフィズム

  • 90

    あるクラスをもとにして、新たな機能を付与した新たなクラスを作ること

    継承

  • 91

    1つひとつのサーバーの性能を強化する施作

    スケールアップ

  • 92

    サーバーの台数を増やして1台当たりの負荷を下げる施作

    スケールアウト

  • 93

    回帰式へのデータへの当てはまりの良さを評価する指標

    決定係数

  • 94

    相関が強い説明変数同士を特徴量として、組み合わせたときに互いに干渉し合うため、分析の精度が悪くなる現象

    多重共線性

  • 95

    サポートベクターマシンにおいて、 マージンの計算には⚪︎⚪︎の公式を使う

    ヘッセ

  • 96

    単語の出現頻度に基づいてテキストを数値ベクトルに変換する方法

    BoW

  • 97

    ソフトウェアを開発する際に、必要なプログラムや説明書、プログラム、サンプルコードなどをまとめたもの

    SDK

  • 98

    MySQL開発者がスピンアウトして開発しているRDBMS

    MariaDB

  • 99

    証券や金融システムなどに多く使われているRDBMS

    Oracle Database

  • 100

    既存手法よりも人間に近い自然な音声を高速に生成できる。音声生成モデル

    WaveNet