3부. 운영과 측정
7장. AI 해킹 말고 Corpus를 만들어라
AEO/GEO 마스터링 v0.2.0
AI 검색이 뜨면 늘 해킹이 따라온다.
AI 전용 파일을 만들면 된다. schema를 특수하게 붙이면 된다. 문장을 AI가 좋아하는 방식으로 쓰면 된다. Reddit에 브랜드를 뿌리면 된다. 가짜 비교 글을 만들면 된다. 이런 말들은 빠르고 달콤하다.
하지만 대부분은 약하거나 위험하다.
Google의 공식 문서 기준으로 보면 AI features에 나오기 위한 별도 machine-readable file, AI text file, 특수 schema가 필수는 아니다. 기존 SEO, crawlability, helpful content, structured data와 visible content의 일치가 더 중요하다. 그러니 "AI가 읽는 파일 하나"를 마법처럼 팔면 의심해야 한다.
그렇다고 corpus가 필요 없다는 뜻은 아니다.
구분이 필요하다. Google AI visibility를 위한 마법 파일로서의 corpus는 약하다. 하지만 agent, MCP, partner integration, internal sales enablement, API documentation, analyst briefing을 위한 corpus는 강하다. 이유가 다르다.
검색엔진을 속이기 위한 corpus가 아니라, 사람이든 AI agent든 정확한 답을 가져가도록 만든 정본 표면이 필요하다.
좋은 corpus는 다음을 포함한다.
- 회사/제품의 한 문장 정의
- 해결하는 문제와 해결하지 않는 문제
- 대상 고객과 비대상 고객
- 기능과 한계
- 가격/도입 방식
- 보안/법적/운영 기준
- 비교 기준
- 사례와 숫자
- 업데이트 로그
- 인용 가능한 짧은 문장
이 corpus는 웹페이지와 따로 놀면 안 된다.
정본은 하나여야 한다. 웹페이지, docs, sales deck, FAQ, llms.txt, markdown export, MCP resource가 서로 다른 말을 하면 오히려 위험하다. AI agent는 그 차이를 해결하지 못하고 이상한 답을 만들 수 있다. 검색엔진도 혼란스러운 신호를 받는다. 사람은 더 혼란스럽다.
따라서 corpus의 목적은 해킹이 아니라 정합성이다.
내부에서 쓰는 말, 고객에게 보이는 말, 검색엔진이 읽는 말, AI가 가져가는 말이 같은 구조를 보게 해야 한다. 이때 corpus는 유행이 아니라 운영체계가 된다.
이 장의 결론은 간단하다.
AI에게 잘 보이려고 가짜 표면을 만들지 마라.
진짜 정본을 만들고, 그것을 사람이 읽는 웹과 agent가 읽는 표면으로 동시에 배포하라.
Early Reader Feedback
원고 피드백 남기기
읽다가 헷갈린 곳, 더 듣고 싶은 사례, 동의하기 어려운 문장을 알려주세요. 공개 댓글이 아니라 저자에게만 전달되는 피드백입니다.