6부. 회사와 부서를 실제로 굴리는 agent ops

18장. AI-first engineering은 agent harness를 만드는 일이다

에이전트 컴퍼니 v0.4.0

개발 조직의 AI 전환도 같은 구조다.

Shopify는 단일 AI 도구를 표준화하지 않았다. 대신 LLM proxy와 MCP server 같은 인프라 레이어를 표준화했다. 여러 도구와 모델이 바뀌어도, 요청은 중앙 gateway를 거치고, 비용과 사용량과 권한은 한 곳에서 관리된다.

이것은 중요한 설계 원칙이다.

빠르게 변하는 영역에서는 tool을 고정하지 말고, tool이 지나가는 운영 레이어를 고정한다.

Shopify 사례에서 특히 중요한 것은 네 가지다.

원칙
Infrastructure standardization
의미
도구가 아니라 AI 요청, 비용, 권한, routing layer를 표준화
원칙
Internal context connection
의미
wiki, PM tool, warehouse, CRM, Slack, calendar를 permission-aware하게 연결
원칙
N-of-1 software
의미
비엔지니어도 자기 업무용 작은 내부 도구를 만들고 배포
원칙
Comprehension debt guardrail
의미
AI가 toil을 줄여도 시스템 이해를 포기하지 않음

Retool의 경험은 이 원칙을 더 현실적으로 만든다. agent가 거의 모든 코드를 써도 엔지니어의 일이 단순해지지 않는다. 남는 것은 review, judgment, prioritization, architecture, UX edge case, security guardrail, production readiness다.

Cursor의 cloud agent 글은 한 단계 더 내려간다. cloud agent는 원격 코딩봇이 아니다. 전용 VM, 의존성, 네트워크 접근, secret redaction, credential management, durable execution, checkpoint, restore, fork, Temporal workflow, conversation state, machine state가 붙은 agent 운영 환경이다.

즉 AI-first engineering의 핵심은 agent에게 "코드를 써"라고 말하는 것이 아니다.

agent가 실행하고 검증할 수 있는 환경을 만드는 것이다.

개발 환경이 제품이 된다.

Harness가 조직 능력이 된다.

Eval과 scenario가 품질 보증이 된다.

그리고 engineer는 구현자가 아니라 agentic workflow의 operator가 된다.

Early Reader Feedback

원고 피드백 남기기

읽다가 헷갈린 곳, 더 듣고 싶은 사례, 동의하기 어려운 문장을 알려주세요. 공개 댓글이 아니라 저자에게만 전달되는 피드백입니다.

본문에서 문장을 드래그한 뒤 누르면 선택 문장이 함께 저장됩니다.

피드백 유형

BiteMark Press는 Cloudflare Web Analytics로 익명 트래픽을 보고, 동의한 경우에만 GA4와 Microsoft Clarity를 켭니다.