問題一覧
1
(1-1)第2次AIブームの特徴として、最も適切な選択肢を1つ選べ
専門分野の知識を大量に蓄え、その知識に基づいて質問に答えるAIが開発された
2
(1-2)AIに期待される性能に関する記述として、最も適切な選択肢を1つ選べ
「弱いAI」は、特定のタスクまたは分野に対してのみ、人間の能力を上回る性能を示す事がある
3
(1-3)意味ネットワークにおいて、「犬は動物である」を表現する際に、「犬」や「動物」は「概念」と呼ばれる。その表記ルールに従って表現すると、「犬は動物である」は「犬」(A)「動物」、「耳は動物の一部である」は「耳」(B)「犬」と表記される
(A)is-a(B)part-of
4
(1-4)知識の表現に関する研究開発として、最も不適切な選択肢を1つ選べ
米国クイズ番組「Jeopardy!」で使用されたワトソンには、ヘビーウェイトオントロジーが応用されていた
5
(1-5)探索木の特徴に関する次の文章の①、②、③の組み合わせとして最も適切な選択肢を1つ選べ 「①は、原理上必ず最短ルートでゴールにたどり着ける。②はメモリ消費が大きくなる傾向にある。③はゴールまで到達するまでに時間がかかる傾向にある」
①幅優先探索、②幅優先探索、③深さ優先探索
6
(1-6)以下の文章を読み、①、②に入る組み合わせとして、最も適切な選択肢を1つ選べ。 第2次AIブームの時に、専門性の高い知識を内包している①が開発された。①には、多数の知識項目を関連付けるルールの一貫性を担保することや、利用者が日常的に使う言葉の曖昧性をくみ取ることが難しい、という②が発生することがある
①エキスパートシステム、②知識獲得のボトルネック
7
(1-7)トイ・プロブレムに関連する記述として、最も適切な選択肢を1つ選べ
ルールが明確に定義されている問題しか解決できない
8
(1-8)以下の文章を読み、①、②に入る組み合わせとして、最も適切な選択肢を1つ選べ。 コンピュータが知識を記号間の相対関係として捉えているため、①といった問題が起こり得る。これの例として②が挙げられる
①記号接地問題、②「イヌ」の英語名や具体的な特徴をテキストで答えられるAIでも、人間のように実物の犬を理解していないので、「イヌの匂い」の様な発展的な概念を把握できない
9
(2−1)教師なし学習に関連する記述として、最も適切な選択肢を1つ選べ
ネットワークアクセスのデータをモデルへの入力とし、その特徴量に基づいて、データを正常アクセスと不正攻撃の2つのクラスターに分類する
10
(2−2)機械学習のモデルが①、②、③の組み合わせとして、最も適切な選択肢を1つ選べ。 機械学習のモデルが、①に対して予測精度が高く、②に対して予測精度が低下している場合に③といえる
①訓練データ、②テストデータ、③汎化性能が低い
11
(2−3)過学習を引き起こす原因として、最も不適切な選択肢を1つ選べ
モデルの関数が単純である
12
(2−4)分類問題の精度指標に関する説明として、最も適切な選択肢を1つ選べ
偽陽性率を低くしようとすると偽陰性率が高くなることがある
13
(2−5)k−分割交差検証法は機械学習においてどのような場合に効果的なのか、次の内最も適切な選択肢を1つ選べ
学習に使用できるデータのボリュームが大きくない場合
14
(2−6)機械学習モデルの汎化性能を向上させるために、モデルのハイパーパラメータの値をチューニングすることがある。ハイパーパラメータの候補値を指定し、その組み合わせを総当りで試すことで自動的に最適化させる手法はどれか
グリッドサーチ
15
(2−7)以下の内、分類問題に用いられる手法として、最も不適切な選択肢を1つ選べ
重回帰分析
16
(2−8)以下の文章を読み、①、②の組み合わせとして、最も適切な選択肢を1つ選べ。 決定木の中でデータの条件分岐をしていく際に、ツリー構造の一番下にある①にたどり着くと、その①に対応する値が当該データの予測値として出力される。①に入るデータを制御することは②に効果的である
①葉、②過学習の防止
17
(2−9)アンサンブル学習を行う目的として、最も適切な選択肢を1つ選べ
モデルの汎化性能を向上させる
18
(2−10)ブースティングを用いたアンサンブル学習に関する記述として、最も適切な選択肢を1つ選べ
複数の弱学習器を逐次的に学習させる際に、誤予測したサンプルに対する重みを増やすことで、後続の学習器において精度を高めようとする
19
(2−11)以下の文章を読み、①に入る概念として、最も適切な選択肢を1つ選べ 。 サポートベクトルマシン(SVM)はパターン認識能力が優れているモデルであり、①というコンセプトに基づいてデータを分割している
マージンの最大化
20
(2−12)以下の文章を読み、①、②の組み合わせとして、最も適切な選択肢を1つ選べ。 K-Meansでは、初期的にデータを①してから、各クラスターの②を計算し、各データを②と一番距離の近いクラスターに割り当て直す。この操作をデータの分配状況が変動しなくなるまで繰り返す
①ユーザーが決めた数のクラスターに分割、②重心
21
(2−13)クラスタリング(クラスター分析)に関する記述として、最も適切な選択肢を1つ選べ
階層クラスター分析は、樹形図を生成する
22
(2−14)機械学習で行われる正則化に関する説明として、最も適切な選択肢を1つ選べ
損失関数に罰則項を追加し、その総和を最小にするようにパラメータを学習する
23
(3−1)以下の文章を読み、①に最もよく当てはまる選択肢を1つ選べ。 ニューラルネットワークモデルの予測値を実際の値に近づけるように学習を行うために、①を定義し、その値を最小化するようにモデルのパラメータを更新する
損失関数
24
(3−2)以下の文章を読み、①、②の組み合わせとして、最も適切な選択肢を1つ選べ。 ニューラルネットワークの中では、予測誤差に関する情報を参考にして重みの更新を行っており、誤差に関する情報はネットワークの中で①していく。この仕組みに由来するネットワークの学習の問題は②である
①出力層から入力層まで伝播、②勾配消失問題
25
(3−3)活性化関数に関する記述の内、最も不適切な選択肢を1つ選べ
ReLU関数の派生版であるLeaky ReLU関数は、元のReLU関数よりも性能が改善されているケースが多い
26
(3−4)以下の文章を読み、①のアルゴリズムとして最も適切な選択肢を1つ選べ。 ニューラルネットワークの最適解は解析的な手法(理論的な数式の変形による解法)で求めることができず、①を用いて少しずつパラメータを更新していく中で最適解に近づく
勾配降下法
27
(3−5)以下の文章を読み、①に当てはまるものとして最も適切な選択肢を1つ選べ。 学習の中で、最適なパラメータの設定にたどり着くまでに、パラメータを何①分も繰り返し更新する必要がある。ただし、①はパラメータが更新された回数を表す量である
イテレーション
28
(3−6)ニューラルネットワークのパラメータを更新する手法は複数あり。訓練データを複数のグループに分けて、グループごとにネットワークに入力して損失関数を計算し、パラメータを更新する仕組みとして、最も適切な選択肢を1つ選べ
ミニバッチ学習
29
(3−7)ドロップアウトの説明として、最も適切な選択肢を1つ選べ
ランダムに一部のニューロンを無効化しながら学習を進めること
30
(3−8)蒸留に関する記述として、最も不適切な選択肢を1つ選べ 。 大きいモデルやアンサンブルモデルを教師モデルとして準備し、その教師モデルの推論結果を生成モデルの学習に利用することで、軽量でありながら教師モデルと同等の精度を期待できるモデルを作成する手法である。
蒸留とは、モデルの学習済みパラメータを新しいタスクのために転用する手法である
31
(3−9)以下の文章を読み、空欄①、②の組み合わせとして、最も適切な選択肢を1つ選べ。 モデルのサイズ(パラメータ数)を圧縮することにより、学習の高速化や効率化を期待できる。①はネットワークの一部の(比較的重要度の低い)ニューロンを剪定する手法である。②は、パラメータをより小さいビット数で表現する手法である
①プルーニング、②量子化
32
(3−10)以下の文章を読み、①、②に当てはまる用語の組み合わせとして、最も適切な選択肢を1つ選べ。 CNNでは、元の画像の上にフィルタを重ねて①を行い、その結果を②へ射影する
①畳み込み演算、②特徴マップ
33
(3−11)GoogLeNetに関する説明として、最も適切な選択肢を1つ選べ
Inceptionモジュールを組み合わせているネットワーク構造である
34
(3−12)リカレントニューラルネットワーク(RNN)に期待される利点として、最も適切な選択肢を1つ選べ
過去の時刻に入力された情報をネットワーク内に保持することで、文脈を考慮したテキスト解析を実現できる
35
(3−14)Deep Q-Network(DQN)の説明として、最も不適切な選択肢を1つ選べ
DQNでは、多数の行動の選択肢から最適な1種類に絞る為に、ε-greedy法を導入している
36
(3−15)以下の文章を読み、空欄に入る選択肢として最も適切なものを1つ選べ。 オートエンコーダは、現在のディープラーニングを用いた画像認識の元になったアルゴリズムと言われている。オートエンコーダは入力が正解と同じであり、出力を入力に近づけるように隠れ層で特徴を抽出する( )の手法である。
教師なし学習
37
(4−1)BoW(Bag-of-Words)に関する説明として、最も適切な選択肢を1つ選べ
形態素解析によって文章を単語などに分解した後、各単語の出現回数に基づいて、文章を数値ベクトルとして表現する手法である
38
(4−2)以下の言語の中で、自然言語処理における分かち書きの考え方が他の言語と異なるものを1つ選べ
中国語
39
(4−3)自然言語処理分野における「構文解析」の説明として、最も適切な選択肢を1つ選べ
文章の係り受け構造を捉える
40
(4−4)TF-IDFの説明として、最も適切な選択肢を1つ選べ
TF-IDFの値が大きい単語ほど、その文書中での重要度が高いと推定できる
41
(4−5)以下の文章を読み、①、②の組み合わせとして、最も適切な選択肢を1つ選べ。 物体検出において、①を用いて、画像の被写体の②を切り出した後に、②を画像分類器に入力してクラスを推定する
①バウンディングボックス、②候補領域
42
(4−6)インスタンスセグメンテーションの手法として、最も適切な選択肢を1つ選べ
Mask R-CNN
43
(4−7)DeepMind社から発表され、複数のエージェントが非同期に学習することを特徴とする強化学習のアルゴリズムとして、最も適切な選択肢を1つ選べ
A3C
44
(4−8)ロボット制御のために、教師あり学習ではなく強化学習を利用する理由として、最も適切な選択肢を1つ選べ
複雑な一連の動きに対して、教師あり学習では、正解データを定義するのが難しい
45
(4−9)以下の文章を読み、①、②の組み合わせとして、最も適切な選択肢を1つ選べ。 Grad-CAMは、画像認識において、①を用いて推論の根拠を可視化する②なモデル解釈手法である。
①勾配情報、②大域的
46
(4−10)以下の文章を読み、①に入るものとして最も適切な選択肢を1つ選べ。 音声認識において、①は発話者の声質や発音の特徴の識別に重要である。
音色
47
(4−11)以下の文章を読み、①、②の組み合わせとして最も適切な選択肢を1つ選べ。 音韻は人の発生を区別できる音の要素である。音韻が近ければ、①の上で観察される②で表されるピーク値も近い値をとる。
①スペクトル包絡、②フォルマント周波数
48
(4−12)時系列データの解析に使用される手法に関して、最も不適切な選択肢を1つ選べ
Sequence-to-Sequence(Seq2Seq)では、入力される系列を事前に同じ長さに揃える必要がある
49
(4−13)以下の文章を読み、①に入るものとして、最も適切な選択肢を1つ選べ。 Transformerでは①を採用することによって、単語の順序に関する情報を入力に加味している。
位置エンコーディング
50
(4-14)以下の文章を読み、①に入る用語として、最も適切な選択肢を1つ選べ。 大規模自然言語モデルでは、汎用的な性能を持たせるために①を行った後に、個別の言語タスクに特化した学習を行う。
事前学習
51
(4-15)GPTの事前学習に使われる学習法として、最も適切な選択肢を1つ選べ
自己教師学習
52
(4-16)GPTおよびそれを用いた文章生成AIについて、最も不適切な選択肢を1つ選べ
プロンプトエンジニアリングとは、GPTが不適切な出力をしないようにモデルのパラメータを調整することである
53
(4-17)敵対的生成ネットワーク(GAN)の仕組みについて、最も適切な選択肢を1つ選べ
ジェネレータをディスクリミネータの学習には、共通の損失関数が用いられている
54
(4-18)Diffusion Modelに関する説明として、最も適切な選択肢を1つ選べ
画像に徐々にノイズを加えた後に、ノイズを除きながら元の画像を復元することを学習する
55
(5-1)AI開発におけるNDAについて、最も適切な選択肢を1つ選べ
プロジェクトが正式に発足する前に、AI開発の方針の判断材料として、秘密情報を含むデータを発注側と受注側でやり取りする場合であっても、当該データの送付前にNDA契約を締結すべきである
56
(5-2)AIプロジェクトを進める体制として、最も不適切な選択肢を1つ選べ
AIシステムの基となるモデルの開発が終了し、運用・保守の段階に入る前に、デザイナーがUIの設計を行う
57
(5-3)AI開発の業務の一部を外部に委託する際に準委任契約を締結することがある。その内容について、最も適切な選択肢を1つ選べ
準委任契約は特定の業務を他方の当事者が実行することについて合意した契約形態である
58
(5-4)「AI・データの利用に関する契約ガイドライン」(経済産業省作成)で推奨されている探索的段階型の開発方式について、最も適切な選択肢を1つ選べ
開発の初期段階においてプロジェクト全体のコスト把握が出来ない場合がある
59
(5-5)PoCについて、最も不適切な選択肢を1つ選べ
PoCフェーズでは、本開発で使用する予定の手法をテストすることが目的なので、本開発と同程度の量のデータを使用する
60
(5-6)アジャイル型の開発様式の特徴として、最も不適切な選択肢を1つ選べ
最初から成果物の仕様と要件を明確に決める事が出来るため、後戻りが少ない
61
(5-7)ビッグデータについて述べたものとして、最も不適切な選択肢を1つ選べ
ビッグデータの定義には、データ量が1TB以上であること、更新頻度が低いことが含まれる
62
(5-8)AIのシステムやサービスを開発、運用、提供するための形態について、最も不適切な選択肢を1つ選べ
オンプレミス形態の開発は、クラウド上での開発に比べて、カスタマイズの自由度が低い
63
(5-9)MLOpsの考え方として、最も不適切な選択肢を1つ選べ
MLOpsでは、機械学習モデルを一度だけ訓練するのではなく、学習データの種類を変えながら同じモデル訓練を繰り返すことで、学習済みモデルの信頼性を高めることが推奨されている
64
(6−1)匿名加工情報と仮名加工情報に関する記述として、最も不適切な選択肢を1つ選べ
匿名加工情報は単体では特定の個人が識別されることはないのに対し、仮名加工情報は単体で特定の個人が識別される可能性がある
65
(6−2)個人データの扱い方について、最も適切な選択肢を1つ選べ
個人情報取扱事業者は、個人データを第三者に提供する時に、一定条件を満たせば、事前に本人の同意を得る必要がない
66
(6−3)AIの開発に個人情報を使用することがある。個人情報の内、要配慮個人情報に該当するものとして、最も不適切な選択肢を1つ選べ
本人の銀行口座の番号
67
経済産業省により公表されている「カメラ画像利活用ガイドブックVer3.0」に基づいて、カメラ画像の扱い方について、最も不適切な選択肢を1つ選べ
個人の顔の一部のみが映り込んでいるカメラ画像は個人情報保護の対象とはならない
68
(6−5)文書生成AIのサービスであるChatGPTに指示を与えるときの注意点として、最も不適切な選択肢を1つ選べ
APIを経由してChatGPTを使用することは、個人情報をはじめとする秘密情報の漏洩を防止する上で効果的といえる
69
(6−6)以下の文章を読み、①に当てはまるものとして、最も適切な選択肢を1つ選べ。 AI開発のプロジェクトにおいて、原則として①は著作権法によって保護されることはないが、その保護が契約の重要な論点となることが多い
学習済みパラメータ
70
(6−7)日本の著作権法に基づき、機械学習の活用に関わる以下の記述のうち、最も不適切な選択肢を1つ選べ
推論用プログラムが著作物として認められることがあるが、学習用プログラムは著作物として認められることがない
71
(6−8)生成AIによる生成物と著作権侵害について、最も適切な選択肢を1つ選べ
著作物を用いて学習させた画像生成AIモデルによって生成されたコンテンツが、学習に使用したものと異なる著作物の著作権を侵害する可能性がある
72
(6−9)開発したプログラムを日本で特許出願するにあたり、発明者となれる人として最も適切な選択肢を1つ選べ。なお、特許法第33条に規定された「特許を受ける権利の移転」はなされていないものとする
プログラムの具体的着想をしたが、プログラミング作業を行う者に指示を与えたのみで、プログラミング作業自体は行っていない者
73
(6−10)不正競争防止法に基づいて定められている限定提供データまたは営業秘密に関して、最も適切な選択肢を1つ選べ
限定提供データは、秘密として管理されている必要がない
74
(6−11)不正競争防止法における営業秘密に該当するものとして、最も不適切な選択肢を1つ選べ
社員の生年月日と住所
75
(6−12)次の文章を読み、①、②の組み合わせとして、最も適切な選択肢を1つ選べ。 AIアルゴリズムの性能が高くなるにつれて、①が問題になり、これに対処するために、モデルによる予測や推論のプロセスの解釈性向上を目指す②の研究が行われている
①ブラックボックス化、②Explainable AI(XAI)
76
(6−13)AI技術の透明性(Transparency)は開発者が考慮すべき重要な観点である。その内容に関して、最も不適切な選択肢を1つ選べ
AIの透明性の確保のためには、より精度の高い最新のアルゴリズムを活用することが有効である
77
(6−14)2018年5月に適用開始されたEU一般データ保護規則(GDPR)に関する説明として、最も不適切な選択肢を1つ選べ
GDPRで認められているデータポータビリティの権利とは、業務提携や事業売却など、複数の事業者が個人情報を扱う場合において、個人データを本人の同意を得ることなく他社に移転し、活用できる権利である
78
(6−15)AIの軍事利用について、最も不適切な選択肢を1つ選べ。ただし、2023年10月時点の状況を問う
日本政府は、人の意思が介在する自律型兵器の研究開発であっても、廃止すべきという声明を出している
79
(6−16)エコーチェンバーについて、最も不適切な選択肢を1つ選べ
AIがユーザーの嗜好パターンを推定し、それに基づいて情報を提供する際に、エコーチェンバーが発生する。これによって情報の多様性が損なわれる可能性が指摘されている
80
1.機械学習における過学習(オーバーフィッティング)に関する記述として、最も適切な選択肢を1つ選べ
データリーケージにより、学習済みモデルの汎化性能の評価が不可能になることがある
81
3.以下の文章を読み、①、②の組み合わせとして、最も適切な選択肢を1つ選べ リカレントネットワーク(RNN)は内部に①を持っているニューラルネットワークであるため、データ値の②を考慮した解析を行うことができる
①フィードバック機構 ②順序
82
6.ニューラルネットワークにおいて、ハイパーパラメータに該当する最も適切な選択肢を1つ選べ
学習率
83
12.ディープラーニングを用いた画像生成モデルとして、最も不適切な選択肢を1つ選べ
PaLM
84
14.CLIP単体を用いて行うことができるタスクとして、最も不適切な選択肢を1つ選べ
自然言語に対応した画像の生成
85
17.著作物として、日本の著作権法によって保護されるための条件として、最も不適切な選択肢を1つ選べ
オリジナルなアイデアであること
86
20.敵対的な攻撃により生じる問題として、最も不適切な選択肢を1つ選べ
大幅なシステム障害が発生し、クラウドサービスなどが停止する
87
21.音声データの処理の流れについて、①、②の組み合わせとして、最も適切な選択肢を1つ選べ 音声をコンピュータで扱うことができるように①を行う。①の操作の1つである標本化を行う際に、②によると、音声データの周波数の2倍を超える周波数でサンプリングをすれば完全に元の音声を復元することが出来る。
①A-D変換 ②サンプリング定理
88
22.以下の文章を読み、①、②の組み合わせとして、最も適切な選択肢を1つ選べ ニューラルネットワークの学習には、同じデータが何回も繰り返し学習に使用される。①は一度のパラメータ更新に用いられる訓練データの数を指し、②は同じ訓練データが繰り返し学習に使われた回数を表す量を指す
①バッチサイズ ②エポック数
89
23.EfficientNetの説明として、最も適切な選択肢を1つ選べ
深さ、広さ、解像度を最適化しながらスケール調整することで、小さなモデルでも高い精度を達成できた
90
24.RNNでは、勾配降下法を用いて誤差逆伝播が行われる点は一般的なニューラルネットワークと共通である。一方で、時間方向に沿って誤差を反映していくため、RNNにおける誤差伝播は特にこう呼ばれる
BPTT
91
35.ROCとAUCの説明として、最も不適切な選択肢を1つ選べ
AUCが0である事は、ランダムに出力が決められていることを示す
92
40.以下の文章を読み、①、②の組み合わせとして、最も適切な選択肢を1つ選べ バンディットアルゴリズムは、①と②のバランスを取るアプローチである。
①報酬が高かった行動を積極的に選択すること ②さらに高い報酬をもたらす行動がないかを探すこと
93
43.コンピュータにとって知能テストやゲームをプレイするよりも、1歳児と同じレベルの知恵と運動能力を獲得する方がはるかに難しいという( )がAI分野の議論に使われている。
モラベックのパラドックス
94
47.ニューラル機械翻訳について、最も不適切な選択肢はどれか
ニューラル機械翻訳のモデルは、Transformerのデコーダから構成される
95
48.スケール則(Scaling Law)について、最も適切な選択肢を1つ選べ
モデルのパラメータ数が増加するにつれて、モデルの性能はほぼ同じ割合で向上する経験則である
96
49.Transformerに入力されたテキストはトークンに分解された後に、それぞれがベクトルに変換される。このベクトルの種類として、最も不適切な選択肢を1つ選べ
ウェート
97
50.深層学習のフレームワークでは、define-by-runを用いて、計算の流れを計算グラフとして構築することがある。define-by-runの説明として、最も不適切な選択肢を1つ選べ
代わりとなる計算グラフが構築されているため、バックプロパゲーションを行わなくてもよい
98
55.2023年に欧州議会で( )が可決され、その中で生成AIの提供事業者に一定の義務を法的に課している。
AI法案(AI Act)
99
59.OpenAI社から公開されたDALL・E2について、最も不適切な選択肢を1つ選べ
オートエンコーダを用いて画像の生成を行う
100
60.CLIPは種類が豊富でかつノイズを含んだ画像で学習されるため、実世界に適用した際にも、( )で様々な領域で画像認識タスクに使用可能である
Zero-shot