データ加工

データ加工
20問 • 2年前
  • 小林健人
  • 通報

    問題一覧

  • 1

    1.他のデータと比べて極端に離れた値 2.外れ値の中で外れた理由がわかる値 3.記録・存在していない状態の値

    外れ値, 異常値, 欠損値

  • 2

    データクレンジングの手法

    データを補完する, データを除外する

  • 3

    1.カテゴリー化のために二値で分けること 2.区間ごとに等間隔で分割する事 3.値に差がある分布が歪んでいる時に行う変換作業 4.スケールがモデルの推定に影響するのを軽減させること

    二値化, ビニング, 対数変換, スケーリング

  • 4

    線形では見えない関係のとき(変数の組み合わせが多くなる)に行う特徴量のエンジニアリング手法

    交互作用特徴量の作成

  • 5

    不要なデータを排除して、正しい傾向を掴むためのデータのみに揃えること

    クレンジング

  • 6

    データクレンジングの手順 ①→ クレンジング方法の意思決定をする ②(データ量が少なすぎないか、重要な値が削除されてないか) ③(正確なデータでない点を理解する)

    外れ値、異常値、欠損の原因を特定, 外れ値、異常値、欠損を削除, 外れ値、異常値、欠損を既定値に変換する

  • 7

    値を別の値と紐付けること

    マッピング処理

  • 8

    マッピング処理に仕様される関数

    Excel, SQL

  • 9

    1.全データから一部データを抽出すること 2.ある範囲の数値から任意に取り出される数値 3.②を用いた値で抽出する方法

    サンプリング, 乱数, 無作為サンプリング

  • 10

    基本統計量 1.データ値を足した合計 2.データの中の一番小さな値 3.データの値を足して、個数で割った数 4.分散の正の平方根の値 5.データの中の一番大きな値 6.データの個数

    合計, 最小値, 平均, 標準偏差, 最大値, レコード数

  • 11

    各値のPythonコード 1.合計 2.最大値 3.最小値 4.レコード数 5.平均 6.標準偏差

    SUM, MAX, MIN, COUNT, AVARAGE, STDEV.P

  • 12

    各言語での子四則演算方法 1.データ型 2.SQL 3.Python 4.Excel

    数値型のみ, 記述内に算術式を入れてデータ取得や挿入, 数値を変数に格納してから計算, セルにイコールから記述

  • 13

    文字コードの変換手順 1→2→3

    変換元と席の文字コードを確認, 変換するためのライブラリの準備, 変換漏れによるバグの要因パターン、変換プログラム実行によるテストパターン検証

  • 14

    PCで処理するために、文字の種類に番号を割り振ったもの

    文字コード

  • 15

    データ共有のために、データを区切るフォーマットファイル2種

    コンマ, タブ

  • 16

    データ共有の為のフォーマット表現技法 1.タグでデータを囲み、入れ子構造が可能 2.名前と値をペアにしたデータ表現

    XML, JSON

  • 17

    データを共有するための挿入表現 1.SQLのリレーショナルデータベースへの表現 2.CSVなどのデータファイルを一括して挿入する表現

    INSERT, LOAD, IMPORT

  • 18

    データ共有作業中に違反すると挿入エラーが起こること

    成約

  • 19

    1.値にNULLがない制約 2.対象列二重服したデータを禁止する制約 3.他のテーブル列を参照し、その列にないデータの挿入を禁止する制約 4.値の条件を設定し、条件に該当しないデータを禁止する制約

    NOT NULL制約, 一意性制約, 外部参照制約, チェック制約

  • 20

    データ連携するサーバー 1.自らの管理スペース内に設置するクラウド型共有サービス 2.File Transfer Protcol方式ノオファイル転送

    ファイル共有サーバー, FTPサーバー

  • ビジネス・行動規範

    ビジネス・行動規範

    小林健人 · 23問 · 2年前

    ビジネス・行動規範

    ビジネス・行動規範

    23問 • 2年前
    小林健人

    プログラミング

    プログラミング

    小林健人 · 24問 · 2年前

    プログラミング

    プログラミング

    24問 • 2年前
    小林健人

    数理基礎

    数理基礎

    小林健人 · 58問 · 2年前

    数理基礎

    数理基礎

    58問 • 2年前
    小林健人

     データ分析

     データ分析

    小林健人 · 20問 · 2年前

     データ分析

     データ分析

    20問 • 2年前
    小林健人

    データベース

    データベース

    小林健人 · 5問 · 2年前

    データベース

    データベース

    5問 • 2年前
    小林健人

    ITセキュリティ

    ITセキュリティ

    小林健人 · 13問 · 2年前

    ITセキュリティ

    ITセキュリティ

    13問 • 2年前
    小林健人

    ビジネス・論理的思考

    ビジネス・論理的思考

    小林健人 · 16問 · 2年前

    ビジネス・論理的思考

    ビジネス・論理的思考

    16問 • 2年前
    小林健人

    tableau アナリスト

    tableau アナリスト

    小林健人 · 100問 · 2年前

    tableau アナリスト

    tableau アナリスト

    100問 • 2年前
    小林健人

    Tableauアナリスト2

    Tableauアナリスト2

    小林健人 · 99問 · 2年前

    Tableauアナリスト2

    Tableauアナリスト2

    99問 • 2年前
    小林健人

    tableau アナリスト

    tableau アナリスト

    小林健人 · 78問 · 2年前

    tableau アナリスト

    tableau アナリスト

    78問 • 2年前
    小林健人

    コンピュータの構成要素

    コンピュータの構成要素

    小林健人 · 21問 · 1年前

    コンピュータの構成要素

    コンピュータの構成要素

    21問 • 1年前
    小林健人

    問題一覧

  • 1

    1.他のデータと比べて極端に離れた値 2.外れ値の中で外れた理由がわかる値 3.記録・存在していない状態の値

    外れ値, 異常値, 欠損値

  • 2

    データクレンジングの手法

    データを補完する, データを除外する

  • 3

    1.カテゴリー化のために二値で分けること 2.区間ごとに等間隔で分割する事 3.値に差がある分布が歪んでいる時に行う変換作業 4.スケールがモデルの推定に影響するのを軽減させること

    二値化, ビニング, 対数変換, スケーリング

  • 4

    線形では見えない関係のとき(変数の組み合わせが多くなる)に行う特徴量のエンジニアリング手法

    交互作用特徴量の作成

  • 5

    不要なデータを排除して、正しい傾向を掴むためのデータのみに揃えること

    クレンジング

  • 6

    データクレンジングの手順 ①→ クレンジング方法の意思決定をする ②(データ量が少なすぎないか、重要な値が削除されてないか) ③(正確なデータでない点を理解する)

    外れ値、異常値、欠損の原因を特定, 外れ値、異常値、欠損を削除, 外れ値、異常値、欠損を既定値に変換する

  • 7

    値を別の値と紐付けること

    マッピング処理

  • 8

    マッピング処理に仕様される関数

    Excel, SQL

  • 9

    1.全データから一部データを抽出すること 2.ある範囲の数値から任意に取り出される数値 3.②を用いた値で抽出する方法

    サンプリング, 乱数, 無作為サンプリング

  • 10

    基本統計量 1.データ値を足した合計 2.データの中の一番小さな値 3.データの値を足して、個数で割った数 4.分散の正の平方根の値 5.データの中の一番大きな値 6.データの個数

    合計, 最小値, 平均, 標準偏差, 最大値, レコード数

  • 11

    各値のPythonコード 1.合計 2.最大値 3.最小値 4.レコード数 5.平均 6.標準偏差

    SUM, MAX, MIN, COUNT, AVARAGE, STDEV.P

  • 12

    各言語での子四則演算方法 1.データ型 2.SQL 3.Python 4.Excel

    数値型のみ, 記述内に算術式を入れてデータ取得や挿入, 数値を変数に格納してから計算, セルにイコールから記述

  • 13

    文字コードの変換手順 1→2→3

    変換元と席の文字コードを確認, 変換するためのライブラリの準備, 変換漏れによるバグの要因パターン、変換プログラム実行によるテストパターン検証

  • 14

    PCで処理するために、文字の種類に番号を割り振ったもの

    文字コード

  • 15

    データ共有のために、データを区切るフォーマットファイル2種

    コンマ, タブ

  • 16

    データ共有の為のフォーマット表現技法 1.タグでデータを囲み、入れ子構造が可能 2.名前と値をペアにしたデータ表現

    XML, JSON

  • 17

    データを共有するための挿入表現 1.SQLのリレーショナルデータベースへの表現 2.CSVなどのデータファイルを一括して挿入する表現

    INSERT, LOAD, IMPORT

  • 18

    データ共有作業中に違反すると挿入エラーが起こること

    成約

  • 19

    1.値にNULLがない制約 2.対象列二重服したデータを禁止する制約 3.他のテーブル列を参照し、その列にないデータの挿入を禁止する制約 4.値の条件を設定し、条件に該当しないデータを禁止する制約

    NOT NULL制約, 一意性制約, 外部参照制約, チェック制約

  • 20

    データ連携するサーバー 1.自らの管理スペース内に設置するクラウド型共有サービス 2.File Transfer Protcol方式ノオファイル転送

    ファイル共有サーバー, FTPサーバー