暗記メーカー
ログイン
cover
データサイエンテスト
  • gko tis

  • 問題数 100 • 11/12/2024

    記憶度

    完璧

    15

    覚えた

    35

    うろ覚え

    0

    苦手

    0

    未解答

    0

    アカウント登録して、解答結果を保存しよう

    問題一覧

  • 1

    各変数における係数の推定値のこと

    偏回帰係数

  • 2

    目的変数の実測値と目的変数の推定値との間の相関係数のこと

    重相関係数

  • 3

    数値で表現されたデータに変換する際に最もよく用いられる方法

    ワンホットエンコーディング

  • 4

    モデルの予測値と実際のデータの差の絶対値の平均

    MAE

  • 5

    MAEの特徴は?

    外れ値の影響を受けにくい

  • 6

    残差の二乗の平均のこと

    MSE

  • 7

    入力データを元にそのデータが陽性である確信度を確率値(0-1)で出力する方法

    ロジスティック回帰

  • 8

    しきい値に依存しない評価指標で 原点と(1.0,1.0)を通る曲線

    ROC曲線

  • 9

    ラベル付け作業のこと

    アノテーション

  • 10

    クラスタの中心点をランダムにk個配置し、中心点と各データの距離の総和が最小になるように中心点を更新する方法

    k-means法

  • 11

    量的変数→カテゴリを表す質的変数に変換

    カテゴライズ

  • 12

    量的変数を等間隔の区間で分割

    ビン化

  • 13

    同一条件下において得られた測定値を平均した値

    アンサンブル平均

  • 14

    効率の良い実験方法を設計し、結果を適切に解析することを目的とする統計学手法

    実験計画法

  • 15

    マージン最大化に基づいて分類の境界線を学習する手法

    サポートベクターマシン

  • 16

    文を単語に分割し、各形態素の属性を判定

    形態素解析

  • 17

    自然言語処理において、用いられる複数の言語理解タスクを一つにまとめたベンチマーク

    GLUE

  • 18

    非圧縮フォーマットの音声データ

    WAV

  • 19

    データ圧縮技術

    コーデック

  • 20

    圧縮前のデータを完全復元可能な音声データのコーデック

    FLAC

  • 21

    圧縮前のデータを完全復元は不可能な音声データのコーデック

    MP3

  • 22

    windowsにおける標準的な動画フォーマット

    AVI

  • 23

    macOSにおける標準的な動画フォーマット

    MOV

  • 24

    Google社によって開発・公開されているweb向けな軽量な動画フォーマット

    WebM

  • 25

    本来、映像や音声を扱うための形式 音声の格納も可能

    MP4

  • 26

    小売店や通販サイトにおける顧客の買い物かごの中身の傾向を解析

    バスケット分析

  • 27

    バスケット分析において、 P(A^B)

    支持度

  • 28

    複数のモデルの予測結果を組み合わせることで汎化性能の高いモデルを生成する手法

    アンサンブル学習

  • 29

    保存を繰り返しても画質が劣化しない

    PNG形式

  • 30

    目視では把握できない情報を削除することでデータを圧縮 保存を繰り返すたびに画質は劣化

    JPG形式

  • 31

    画像の縁にダミーのデータを挿入する処理

    パディング

  • 32

    各モデルを並列的に学習する手法

    パギング

  • 33

    各モデルを直列的・逐次的に学習させる手法

    ブースティング

  • 34

    プログラムツールを用いてWebサイトからデータを取得すること

    ウェブスクレイピング

  • 35

    プログラムがインターネット上のリンクを辿ってwebサイトを巡回し、webページ上の情報を収集する技術

    ウェブクローリング

  • 36

    webクロージングを行うプログラム

    ウェブクローラ

  • 37

    プログラム同士で通信を行うための仕組み

    API

  • 38

    XMLフォーマットで通信を行うプロトコルを定義したもの

    SOAP

  • 39

    日本語で「関係データベース」

    RDB

  • 40

    RDBのテーブル間の複雑な関係性を分かりやすく可視化する図

    ER図

  • 41

    データのまとまり

    エンティティ

  • 42

    エンティティの各要素

    アトリビュート

  • 43

    エンティティ間の関係性を示す線

    リレーション

  • 44

    リレーションの始点と終点を一定の記号で表現

    カーディナリティ

  • 45

    ネットワークを介してデータをやりとりするための手順

    FTP

  • 46

    転送するファイルをSSHで、暗号化する方式を採用

    SCP

  • 47

    暗号化されていない状態でやりとりされる HTMLなどの情報をやり取りする際に使われる通信プロトコル

    HTTP

  • 48

    HTTPSとは⚪︎⚪︎を利用してデータを暗号化している HTTPと同じ通信方式

    TLS

  • 49

    統計解析を目的として利用するプログラミング言語

    R

  • 50

    非プログラミング言語で、データ分析を容易にするBIツールの一種 画面上で感覚的に操作可能なデータ分析ソフトウェア

    Tableau

  • 51

    様々な種類のデータベースに接続しているGUIを介したデータ操作を可能にするツール

    DBeaver

  • 52

    大規模データを効率的に分散処理・管理するためのソフトウェア基盤の一つ

    Apache Hadoop

  • 53

    分散保存されたデータを収集し、計算などの処理を施すためのフレームワーク

    MapReduce

  • 54

    ビッグデータや機械学習など大規模なデータを扱うクラスターコンピューティング向け分散処理フレームワーク

    Spark

  • 55

    セキリュティ3要素を答えよ

    機密性, 完全性, 可用性

  • 56

    アクセス制御を実現するための3要素

    認証, 認可, 監査

  • 57

    コンテナ型の仮想化を実装するソフトウェア

    Docker

  • 58

    スキルセットの異なる機械学習エンジニアと実運用者を効率的につなぐための考え方

    MLOps

  • 59

    購入までのプロセスを認知、関心、欲求、記憶、行動の5つに分類し、消費者の行動を細分化する

    AIDMA

  • 60

    ビジネスにおけるステークホルダーを全て列挙し、製品、金銭、情報の流れを明確にする手法

    CVCA

  • 61

    物事の構成要素を考える際、列挙する要素に漏れや重複が発生しないようにするフレームワーク

    MECE

  • 62

    「目標と主な結果」という意味をもつ目標管理の指標

    OKR

  • 63

    目標を達成するための指標

    SMART

  • 64

    主要な成功要因

    CSF

  • 65

    一定の条件を満たした場合に、本人の許可を得ていなくとも第三者に個人情報を提供可能なこと

    オプトアウト

  • 66

    他の情報と照合しない限り特定の個人を識別することができないように個人情報を加工した情報

    仮名加工情報

  • 67

    EU域内の個人データ保護を規定する法律

    GDPR

  • 68

    消費者プライバシーについて規定した米国の個人情報保護法

    CCPA

  • 69

    CCPAの改正案

    CPRA

  • 70

    入力された文が英文法的に正しいかを判定する

    CoLA

  • 71

    入力された文(映画レビュー)を分類する(評判がポジティブかネガティブかを判定する)

    SST-2

  • 72

    入力された2つの文の意味が同じかどうかを判定する

    MRPC

  • 73

    入力された2つの文の意味の類似性を評価する

    STS

  • 74

    入力された2つの質問文の意味が同じかどうかを判定する

    QQP

  • 75

    入力された2つの文の含意関係(含意・矛盾・中立)を判定する

    MNLI

  • 76

    あるパラグラフとそれに対する質問が入力され、パラグラフが質問に対する正しい回答を含んでいるか否かを判定する

    QNLI

  • 77

    入力された2つの文の含意関係を判定する

    RTE

  • 78

    ある代名詞が文中のどの名詞を指しているのかを判定する

    WNLI

  • 79

    モデルの訓練誤差が十分小さいにもかかわらず、汎化誤差が大きいこと

    過学習

  • 80

    機械学習において、説明変数の数が増えると、学習の難しさが指数的に増加する現象

    次元の呪い

  • 81

    2つの結果しか生じないような試行のこと

    ベルヌーイ試行

  • 82

    通し番号をつけた名簿を作成して、1番目の調査対象を無作為に選び、2番目以降の調査対象を一定間隔で抽出する方法

    系統抽出法

  • 83

    母集団をいくつかのグループに分け、そこから無作為抽出でいくつかのグループを選ぶ操作を繰り返して、最終的に選ばれたグループの中から調査対象を無作為に抽出する方法

    多段抽出法

  • 84

    母集団を小集団である「クラスタ」に分け、分けられたクラスタの中きらいくつかのクラスタを無作為に抽出し、それぞれのクラスタ内全ての個体を調査する方法

    集落抽出法

  • 85

    母集団をあらかじめいくつかの層に分けておき、各層の中から必要な数の調査対象を無作為に抽出する方法

    層別抽出法

  • 86

    データの個々の要素を1つのクラスタとして扱い、距離の近いクラスタ同士を結合する手法

    階層型クラスタリング

  • 87

    オートエンコーダというネットワークを確率モデル化し、未知のデータを確率的に作成できるようにしたもの

    VAE

  • 88

    しきい値に依存しない評価指標として (0.5〜1までの値をとる曲線

    AUC

  • 89

    階層型クラスタリングの結果は⚪︎⚪︎という図で表される

    デンドログラム

  • 90

    機械学習において、 ある入力データに対して、適切な連続値を出力すること

    回帰

  • 91

    機械学習において、 ある入力データに対し、適切なカテゴリ(病気である/病気でないなど)を出力すること

    分類

  • 92

    自然言語処理において、 出現頻度の少ない単語や、タスクに関係のない単語

    ストップワード

  • 93

    自然言語処理において、 単語の語幹を抽出する処理

    ステミング

  • 94

    ニューラルネットワークが多層化しすぎると学習が思うように進まなくなる現象

    勾配消失

  • 95

    オープンソースのRDBMの一つ さまざまな OSに対応しており、小規模なシステムから大規模なものまで対応できるといった長所がある

    MySQL

  • 96

    オープンソースのRDBMの一つ カリフォルニア大学バークレー校のコンピュータサイエンス学部で開発開始

    PostgreSQL

  • 97

    サーバとして利用するのではなく、アプリケーションに組み込んで利用するRDBM

    SQLite

  • 98

    重要目標達成指標のこと

    KGI

  • 99

    IoTをコアとして現実空間と仮想空間ご相互連関し、より高度な社会を実現していく仕組み

    CPS

  • 100

    独自に収集したデータ

    一次データ