Методология

Как Intendity измерва видимостта при AI търсене.

Пълната методология зад всяка метрика в таблото. Изпълнение на промптове, откриване на споменавания, оценяване на видимост, share of voice, покритие на цитати. И ограниченията на измерването, заявени изрично.

Философия на измерването

Единичен отговор е анекдот. Много отговори са сигнал.

Генеративните модели са недетерминистични по дизайн. Един и същи промпт, зададен два пъти в една и съща минута, може да върне различни брандове, различни формулировки, различни цитати. Всяка рамка за измерване, третираща единичен отговор като абсолютна истина, ще заблуди.

Intendity третира AI видимостта като разпределение при много изпълнения. Всяка метрика в таблото е обобщение на матрицата (промпт × модел × регион) за даден ден. Дневен резултат за видимост 64 означава: от всички промптове, пуснати на всички следени модели през последните 24 часа, брандът е назован в 64% от тях. Дисперсията се поглъща от средната стойност; тенденцията за седмици разкрива реалния сигнал.

Ето защо смислената AEO програма изисква ежедневна автоматизация. Ръчните проверки под-вземат извадки; малките набори от промптове под-покриват пътя на купувача; проверките с един модел пропускат начина, по който отговорите се различават между доставчиците.

Какво улавяме на изпълнение

Шест структурирани сигнала на (промпт × модел) изпълнение.

Всяко изпълнение произвежда един ред в таблицата runs (суров отговор на модела, статус, версия на модела, регион) и един ред в таблицата mentions (парснатият анализ по-долу). И двете се пазят вечно на Pro планове.

  • Статус на споменаване

    Дали следеният бранд е назован в отговора. Булево. Движи изчисленията на процента на споменаване.

  • Позиция

    Където брандът се появява в отговора. Първият назован бранд закотвя набора за разглеждане; по-късните споменавания се претеглят по различен начин за производните метрики.

  • Настроение + резултат

    Позитивна, неутрална или негативна класификация с резултат от 0 до 100. Улавя дали висок процент на споменаване е добра новина или проблем за безопасността на бранда.

  • Цитирани извори

    Всеки URL, цитиран от модела вградено. Wikipedia, Reddit нишки, специализирана преса, класации, твоите собствени страници. Движи анализа на покритието на цитатите.

  • Споменавания на конкуренти

    Всеки друг назован бранд в същия отговор с тяхната позиция и настроение. Движи share of voice.

  • Извлечен контекст

    Точните 1–2 изречения около споменаването на бранда, дословно. Използва се за открива халюцинации и качествен преглед.

Метаданните на изпълнението (версия на модела, регион, времева марка, флаг за режим на сърфиране) се улавят отделно, така че историческите сравнения остават равнозначни при актуализации на модела.

Откриване на споменаване

LLM базиран парсер с оценяване на достоверност.

Наивният подход на string-match за открива на споменавания се разпада при три класа входове: двусмислени имена на бранд, припокриващи се с общ език (бранд, наречен "Apex", съответстващ на несвързан текст), псевдоними ("Acme Corp" срещу "Acme") и непреки препратки ("водещият корпоративен CRM в Европа", сочещ конкретен бранд без да го назовава).

Парсерът на Intendity е базиран на LLM. За всяко изпълнение суровият отговор на модела плюс регистрираното название на бранда, псевдонимите, домейна и контекста на категорията се подават на парсера, който произвежда структуриран изход: назован ли е брандът, където, редом с кои конкуренти, с какво настроение, цитирайки кои извори, с каква достоверност.

Резултатите за достоверност са от 0 до 100. Резултат над 80 показва недвусмислено, назовано споменаване. Резултатите между 50 и 80 обикновено отразяват случаи с псевдоним или непряка препратка. Резултатите под 50 са маркирани за преглед и изключени от изчисленията по подразбиране. Напредналите потребители могат да регулират прага или да видят куп с ниска достоверност.

Съгласието с ръчно кодирани базови линии е над 90% при наборите от промптове, с които сме измервали. Граничните случаи — особено непреки препратки и кратки двусмислени имена на бранд — са активна зона за подобрение.

Формули за оценяване

Три метрики, всички дефинирани.

Всяка метрика в таблото е публикувана. Без черни кутии.

Резултат за видимост

Дневен агрегат от 0 до 100. Процент на споменаване при всички (промпт × модел × регион) изпълнения в 24-часовия прозорец.

visibility_score(ден) = 100 × mentioned_runs(ден) / total_runs(ден)

Share of voice

Споменаванията на бранда, разделени на общите споменавания в назования конкурентен набор, при същия набор от промптове и времеви прозорец. Разкрива дали увеличенията на видимостта идват от растеж на категорията или от изместване на конкретни конкуренти.

share_of_voice = brand_mentions / (brand_mentions + sum(competitor_mentions))

Покритие на цитатите

От URL адресите, цитирани от модела за набора от промптове на категорията, процентът, в който брандът има значимо позиционирано присъствие (назован в статията, профилиран, включен в таблица за сравнение). Водещ индикатор: високото покритие на цитатите днес предсказва по-висок процент на споменаване следващото тримесечие.

citation_coverage = positioned_source_urls / total_cited_source_urls
Честота на изпълнение и свежест

Ежедневна автоматизация, изпълнения при поискване, улавяне на версия.

Pro акаунтите пускат всеки активиран промпт срещу всеки активиран модел всеки ден по подразбиране. Ръчните изпълнения при поискване са неограничени. Безплатните акаунти пускат ръчно с дневна горна граница; резултатите все пак се запазват, но историята е съкратена до 3-дневен прозорец.

Всяко изпълнение улавя низа на версията на модела, върнат от доставчика. Когато OpenAI пусне нов GPT, Anthropic пусне нов Claude или Google завъртне показалеца Gemini Pro, промяната е видима в таблицата с изпълнения и линиите на тенденция остават интерпретируеми при прехода.

Регионът по подразбиране е основният пазар на бранда. Проследяването в множество региони се поддържа на Pro и се препоръчва за всеки бранд, опериращ в повече от една страна — AI отговорите варират по език и locale, понякога драматично.

Реален пример

Как изглеждат 360 реални споменавания.

Числа от скорошна седмица изпълнения по нашите най-ранни тестови акаунти (2 акаунта, 6 бранда, смесени категории — румънски местни услуги и корейски грижа за кожата). Малка извадка, умишлено пристрастна смес от категории. Показваме я, защото алтернативата — непрозрачни страници за методология от типа "довери ни се" — е по-лоша. Това не са индустриални показатели. Те са доказателства, че системата произвежда структурирани данни с формата, описана по-горе.

  • Споменавания в извадката
    360

    За единична скорошна седмица.

  • Процент на споменаване
    33%

    Брандът е назован в ≈1 от всеки 3 изпълнения.

  • Дял на позиция 1
    35%

    От изпълненията, назоваващи бранда, 35% са го поставили на първо място.

  • Уловени цитати на извори
    297

    При 36 изпълнения, в които моделът е цитирал URL адреси вградено.

  • Различни цитирани домейни
    100

    Дълга опашка в тази извадка; концентрирана в производствените набори от промптове.

По-голям, умишлено проектиран изследователски проект в рамките на единична дефинирана категория (~30 промпта × 4 модела × 14 дни) е в ход; резултатите ще бъдат публикувани на /bg/blog при завършване.

Ограничения и известни отклонения

Какво не прави тази методология.

Заявено изрично, тъй като алтернативата е купувачите да ги открият по-късно:

  • Размер на извадката. Набор от промптове от 10 промпта × 4 модела × 1 регион произвежда 40 изпълнения/ден. Достатъчно за проследяване на тенденцията, недостатъчно за открива малки разлики. Препоръчват се набори от 30+ промпта за стратегически решения.
  • Непреки препратки. Отговорите, описващи бранд без да го назовават ("водещата корпоративна платформа в тази сфера"), се улавят частично от LLM парсера с по-ниска достоверност. Чисто непреките споменавания остават под-изброена гранична ситуация.
  • Дисперсия от страна на доставчика. Отговорите на API на доставчика понякога се различават от отговорите, видими в приложения за потребители (различни настройки по подразбиране, различни сигнали за класиране). Intendity използва API на доставчика; абсолютните числа може да се различават от ръчната проверка на купувача в приложението, въпреки че тенденциите корелират.
  • Без причинно-следствено приписване. Препоръка, доставена на 1-ва седмица, и процент на споменаване, нарастващ на 4-та седмица, са корелация, не доказателство. Множество променливи се движат едновременно. Ние извеждаме данните; приписването е преценката на ръководителя на програмата.
  • Корекцията на халюцинации е на ниво извор. Intendity не моли модела да забрави лоша информация. Ние извеждаме основния извор, на който разчита моделът (остарял параграф в Wikipedia, остаряла нишка с рецензии), и препоръчваме корекцията на ниво извор. Актуализациите на извора се разпространяват в отговорите на модела в рамките на 1–6 седмици след повторното обхождане.

Приложи методологията.

Пусни първия си бранд и виж видимостта, share of voice и покритието на цитатите на реални промптове за пет минути.