Gemini 3 Flash është një model i inteligjencës artificiale i shpejtë dhe mjaft i zgjuar.
Por, sipas një vlerësimi të bërë nga një grup testimi i pavarur, nëse i pyesni diçka që ai në të vërtetë nuk e di – diçka të pakuptueshme, të vështirë apo jashtë njohurive të tij – pothuajse gjithmonë do përpiqet të përgjigjet duke gënjyer apo shpikur diçka.
Në testet e “shkallës së halucinimeve” (hallucination rate) në benchmark‑in AA‑Omniscience, Gemini 3 Flash arriti një 91 për qind - që do të thotë se edhe kur nuk pati një përgjigje të saktë, ai dha përgjigje gjithsesi, dhe shpesh ajo ishte krejtësisht e trilluar.
Ky fenomen i “shpikjes së përgjigjeve” është një problem i njohur te modelet e gjenerimit të tekstit: të dish kur të ndalosh dhe të thuash “nuk e di” është po aq i rëndësishëm sa edhe të dish të përgjigjesh. Sipas këtij testi, Gemini nuk e bën këtë shumë mirë.
Megjithatë, kjo nuk do të thotë se 91 për qind e përgjigjeve të tij janë të gabuara. Kjo shifër tregon vetëm sa shpesh ai shpik diçka në situata kur përgjigjja e vërtetë do të ishte “nuk e di”.
Edhe pse Gemini 3 Flash mund të jetë shumë i fuqishëm dhe performon mirë në testet e përgjithshme, ai është shumë i vetëbesuar edhe kur duhet të ishte i kujdesshëm - që mund të jetë problem në përdorime serioze.