Cách tôi tăng hiệu suất sản phẩm AI lên 10 lần với 10 kỹ thuật prompt engineering

18 phút đọc
Arun Agrahri
Arun Agrahri@arunagrahri
Cách tôi tăng hiệu suất sản phẩm AI lên 10 lần với 10 kỹ thuật prompt engineering

Tôi nhìn chằm chằm vào hóa đơn OpenAI: $186 trong một tuần.

Đối với một solopreneur đang bootstrap ba sản phẩm alpha, con số đó thật đáng sợ. TaffySearch, sản phẩm "lớp thông minh cho video" của tôi, đang đốt token như điên.

AI đáng lẽ phải tự động trích xuất insights từ video YouTube. Thay vào đó, nó tạo ra rác 60% thời gian, buộc người dùng phải chạy lại phân tích, nghĩa là... nhiều API calls hơn, chi phí cao hơn, những người thử nghiệm đầu tiên không hài lòng bỏ đi.

Tuần đó vào tháng 9 năm 2024, tôi tình cờ phát hiện nghiên cứu nội bộ của Anthropic về prompt engineering. Không phải lời khuyên chung chung "hãy rõ ràng và cụ thể" mà bạn thấy khắp nơi. Những kỹ thuật thực sự, đã được kiểm chứng thực tế mà các team của họ sử dụng để xây dựng Claude.

Tôi đã dành 72 giờ triển khai những kỹ thuật này trên cả ba sản phẩm: TaffySearch (video intelligence), Sena (AI networking connector), và Recmend (theo dõi dinh dưỡng từ ảnh).

Kết quả:

  • Chi phí API giảm 68% ($186/tuần → $60/tuần)
  • Độ chính xác trích xuất insights của TaffySearch tăng từ 62% lên 94%
  • Matching kết nối của Sena chuyển từ "thú vị" thành "đây là phép màu"
  • Lỗi nhận dạng thực phẩm của Recmend giảm 83%
  • Tổng token usage giảm 71% trên cả ba sản phẩm

Quan trọng hơn: Tôi không còn sợ sự khó đoán của AI nữa. Tôi đã học cách kiểm soát nó.

Đây chính xác là những gì tôi đã làm, với các prompts thực từ sản phẩm của tôi mà bạn có thể "ăn cắp".

Sai lầm $748 dẫn đến khám phá này

Trước khi chia sẻ các kỹ thuật, bạn cần hiểu mọi thứ tệ đến mức nào.

Tính năng cốt lõi của TaffySearch phân tích video YouTube và comments để trích xuất leads tiềm năng cho các team sales B2B. Người dùng upload URL video, chúng tôi quét nó và trả về: tên công ty được đề cập, chức danh công việc trong comments, tín hiệu mua hàng. Ví dụ: "Có ai biết CRM tốt cho doanh nghiệp không?" = lead đủ điều kiện.

Prompt ban đầu của tôi gửi cho Claude trông như thế này:

Analyze this YouTube video transcript and find potential leads for B2B sales.

Chỉ có vậy. Mười ba từ. Và nó khiến tôi mất sáu tuần địa ngục phát triển.

AI đôi khi trả về kết quả hoàn hảo. Lần khác, nó liệt kê mọi người được đề cập trong video, bao gồm cả nhân vật hư cấu từ quảng cáo. Nó gắn cờ ai đó hỏi về đề xuất CRM nhưng bỏ lỡ VP Sales nói rằng họ đang "đánh giá các công cụ mới."

Output không nhất quán nghĩa là người dùng chạy lại phân tích. Chạy lại nghĩa là token usage tăng 2-3 lần. Và vì tôi đang cung cấp dùng thử miễn phí cho những người thử nghiệm alpha đầu tiên để lấy feedback, tôi phải chịu những chi phí đó trong khi không học được gì về điều gì thực sự hoạt động.

Trong sáu tháng: khoảng $748 chi phí API không cần thiết. Đối với một solopreneur bootstrap, đó là tiền thật.

Điểm bùng phát đến khi một người thử nghiệm đầu tiên — một consultant sales mà tôi đã thuyết phục dùng thử sản phẩm — nói chất lượng lead là "ngẫu nhiên." Họ nhận được 47 leads từ một video, 3 từ một video tương tự, và không thể hiểu tại sao. Họ ngừng sử dụng.

Tôi đã sẵn sàng xây dựng lại toàn bộ hệ thống khi tìm thấy tài liệu của Anthropic ẩn trong GitHub repos và blog posts của họ. Họ đã âm thầm xuất bản nghiên cứu về prompt engineering cho Claude, nhưng nó không được đóng gói như "hướng dẫn tối thượng."

Nó rải rác: một blog post ở đây, một cập nhật doc ở kia, một comment tình cờ trong Discord của họ.

Tôi đã tổng hợp tất cả thành 10 kỹ thuật và áp dụng có hệ thống.

Sáu tuần sau, TaffySearch là một sản phẩm khác.

Hãy để tôi cho bạn thấy cách những điều này hoạt động với các ví dụ thực từ sản phẩm của tôi.

1. Giọng điệu hợp tác (Cách sửa "Ngừng thụ động")

Vấn đề: Tôi viết prompts như thể sợ làm mất lòng AI.

Prompt tệ (Recmend):

Could you maybe tell me what food this might possibly be and if you have time, some nutritional info would be nice?

Giọng điệu thụ động này khiến Claude do dự. Nó sẽ nói những thứ như "Đây có vẻ có thể là một loại bowl ngũ cốc nào đó, nhưng tôi không thể chắc chắn…" Không hữu ích khi người dùng muốn số macro chính xác.

Prompt tốt (Recmend):

Identify the food items in this image and provide exact nutritional data. 
List each item separately with calories, protein, carbs, and fats.

If you're uncertain about an item, state your confidence level (high/medium/low) but always provide your best estimate.

Kết quả: Độ tin cậy nhận dạng thực phẩm trong responses tăng từ trung bình 60% lên 92%. Người thử nghiệm đầu tiên ngừng phàn nàn về câu trả lời mơ hồ.

2. Nguyên tắc rõ ràng (Động từ hành động + Số lượng + Đối tượng)

Prompt tệ (TaffySearch):

Find leads in this video.

Prompt tốt (TaffySearch):

Extract exactly 20 potential B2B sales leads from this YouTube video transcript and comments. 
Focus on: 
  (1) company names mentioned, 
  (2) job titles indicating decision-making authority, 
  (3) email addresses or contact patterns, 
  (4) buying signals like "looking for" or "need a solution for". 

Target audience: B2B sales teams prospecting in the SaaS and consulting industries.

Sự khác biệt? "Find leads" mơ hồ của tôi trả về từ 0 đến 150 kết quả. Prompt rõ ràng trả về các batch 20 leads nhất quán, chất lượng cao, được xếp hạng theo độ mạnh tín hiệu.

Một người thử nghiệm đầu tiên (một marketer freelance) gửi DM cho tôi: "Bất cứ điều gì bạn thay đổi tuần trước, đừng động vào. Cái này thực sự hoạt động rồi."

3. Xác định ranh giới (Điều này giảm 40% chi phí API của tôi)

Ranh giới là các ràng buộc: độ dài, phong cách, format, những gì cần bao gồm, những gì cần tránh.

Prompt tệ (Sena):

Suggest people for this user to connect with at the conference.

Điều này tạo ra các bài luận. Những bài luận đẹp, sâu sắc về lý do tại sao Người A nên gặp Người B. Mỗi response: 800-1200 tokens. Hoàn toàn không bền vững khi tôi bắt đầu có nhiều alpha testers hơn.

Prompt tốt (Sena):

Suggest 10 connection matches for this attendee at the conference.

CONSTRAINTS:
- Maximum 3 sentences per suggestion
- Format: Name | Role | Why connect (one specific reason)
- Avoid generic reasons like "similar interests"
- Include only attendees with confirmed attendance
- Exclude anyone they've already connected with (check past_connections array)
- Focus on: complementary skills, shared industry challenges, or strategic partnership potential

Example format:
Sarah Chen | VP Product at DataCo | Both tackling real-time analytics scalability — she mentioned ML optimization in her session abstract

Token usage mỗi phân tích giảm 82% (từ ~1,000 tokens xuống ~180 tokens mỗi gợi ý). Chất lượng kết nối tương đương, bền vững hơn nhiều để vận hành.

4. Lập kế hoạch rồi mới hành động (Quy tắc "Ngừng one-shot các tác vụ phức tạp")

Đối với tính năng "Script Analysis" của TaffySearch — nơi chúng tôi trích xuất content frameworks từ các video thành công để người dùng có thể tái tạo — ban đầu tôi prompt:

Analyze this video and create a content framework others can use.

Output lung tung. Đôi khi tôi nhận được bullet points. Đôi khi một bài luận narrative. Đôi khi chỉ là timestamps.

Cách tiếp cận nhiều giai đoạn:

Giai đoạn 1: Blueprint

Analyze this YouTube video transcript and create an outline of its content structure. 
Identify:
1. Hook/opening (first 30 seconds)
2. Main segments with timestamps
3. Key transitions
4. Call-to-action placement

Return as a structured outline only. Do not write the full framework yet.

Giai đoạn 2: Tinh chỉnh (sau khi review outline)

Good outline. Now for the "Problem/Solution" segment at 2:45-7:30, 

break down:
- How they frame the problem (exact phrasing)
- What emotional triggers they use
- How they position their solution
- What specific language patterns are repeated

Giai đoạn 3: Framework cuối cùng

Based on the approved outline and segment analysis, create a 5-step content framework template that other creators can follow. 

Each step should include:
- What to do
- Example from this video
- Why it works
- How to adapt it

Format as a copyable template.

Cách tiếp cận ba giai đoạn này mất nhiều thời gian hơn để xây dựng nhưng tạo ra frameworks mà mọi người thực sự sử dụng. Một alpha tester đã dùng framework của chúng tôi để tạo video đạt 180K views. Video tốt nhất trước đó của họ là 12K. Họ ngay lập tức chuyển thành người dùng trả phí.

5. Yêu cầu output có cấu trúc

Prompt tệ (TaffySearch):

Tell me what insights are in this video's comments.

Tôi nhận được một paragraph narrative. Văn xuôi đẹp, vô dụng cho frontend của tôi.

Prompt tốt (TaffySearch):

Analyze this video's comments and return insights in JSON format:

{
  "engagement_metrics": {
    "total_comments": int,
    "avg_sentiment": float (-1 to 1),
    "controversy_score": float (0 to 1)
  },
  "top_topics": [
    {
      "topic": string,
      "mention_count": int,
      "sentiment": string,
      "example_comment": string
    }
  ],
  "business_opportunities": [
    {
      "opportunity_type": string,
      "signal_strength": string (high/medium/low),
      "evidence": [array of relevant comment excerpts],
      "suggested_action": string
    }
  ]
}

Return ONLY valid JSON, no markdown formatting, no explanatory text.

Dữ liệu có cấu trúc tôi có thể pipe trực tiếp vào database. Không còn ác mộng parsing.

6. Giải thích lý do tại sao

Kỹ thuật này có tác động lớn nhất đến độ chính xác của Recmend.

Prompt tệ (Recmend):

Tell me the calories in this meal.

Prompt tốt (Recmend):

Calculate nutritional data for this meal photo. 

CONTEXT: This is for a fitness tracking app where users need accurate macros to hit specific protein targets (typically 0.8-1g per lb bodyweight). 
They're comparing this meal against their daily goals and deciding whether to eat more/less of certain items.

GOAL: Provide nutritional data accurate enough that users can make immediate decisions about their next meal. 
Underestimating protein by 20g could mean they miss their daily target.

USER PROFILE: {user_goal}, {current_intake_today}, {remaining_macros}

Calculate and return:
- Total calories
- Protein (g)
- Carbs (g)  
- Fats (g)
- Confidence level for each estimate
- Which items are estimated vs. standard database values

If any item is ambiguous (e.g., "chicken breast" could be 4oz or 8oz), ask for clarification or provide a range.

Context về tại sao độ chính xác quan trọng khiến Claude thận trọng hơn với các ước tính. Trước: nó sẽ tự tin ước tính "grilled chicken = 35g protein" mà không biết khẩu phần. Sau: nó sẽ đưa ra phạm vi hoặc đặt câu hỏi.

Phàn nàn của người dùng Recmend về số calories "sai quá xa" giảm từ gần như mọi feedback khác xuống chỉ còn các trường hợp biên lẻ tẻ trong tháng đầu tiên.

7. Nghệ thuật ngắn gọn và chi tiết (Nói cho nó biết cần đi sâu đến đâu)

Tôi đã lãng phí hàng nghìn tokens vào các responses quá chi tiết khi người dùng muốn tóm tắt nhanh.

Prompt tệ (Sena):

Explain why these two people should connect.

Tôi nhận được ba paragraphs. Cho một tính năng hiển thị 50 gợi ý, điều đó quá choáng ngợp.

Prompt tốt (Sena):

Explain why these two people should connect. 
BE CONCISE: maximum 2 sentences, written like a mutual friend making an intro at a party. 

Focus on one specific reason that would make them both say "oh interesting, let's chat."

vs. khi tôi thực sự cần chi tiết:

Prompt tốt (TaffySearch — Deep Analysis):

Analyze this video for content strategy insights. 

PROVIDE EXPERT DEPTH: Think step-by-step through the creator's decisions. 

Include:
- Why this hook works psychologically
- How the pacing maintains attention
- What editing choices enhance the message
- How they build credibility
- What makes it shareable

Write as if explaining to a content strategist who will use these insights to brief their team. 
Be comprehensive.

Điểm mấu chốt: nói rõ "be concise" hoặc "provide expert depth" cho tôi quyền kiểm soát độ dài response, điều này trực tiếp kiểm soát chi phí tokens.

8. Cung cấp scaffold (Templates = Nhất quán)

Điều này giải quyết vấn đề "format ngẫu nhiên" của TaffySearch.

Prompt tệ (TaffySearch):

Create an outreach email for this lead.

Format output thay đổi lung tung. Đôi khi formal, đôi khi casual. Đôi khi 3 paragraphs, đôi khi 6. Khó duy trì brand voice.

Prompt tốt (TaffySearch):

Create an outreach email for this lead using this exact template:

Subject: [Hook related to their YouTube comment/activity]

Hi [First Name],

[One sentence about where you saw them - specific video or comment]

[One sentence about shared problem/interest based on their activity]

[One specific value proposition - what you can help with]

[Soft call-to-action - not asking for a meeting, asking for a quick reply]

[Your name]

CONSTRAINTS:
- Keep each sentence under 15 words
- Use their actual words from their comment when possible
- Tone: Helpful peer, not salesperson
- No: marketing buzzwords, exclamation points, or anything that sounds automated

9. Nói ngôn ngữ của AI (Power phrases thực sự hiệu quả)

Anthropic đã công bố các cụm từ cụ thể kích hoạt responses tốt hơn. Tôi đã hoài nghi. Rồi tôi test chúng.

Trước (TaffySearch — Competitor Analysis):

Compare these two YouTube channels and tell me what's different.

Sau (TaffySearch — Competitor Analysis):

Act as a YouTube strategy analyst with 10+ years of experience.

Compare these two YouTube channels. Think step-by-step through:
1. Content strategy differences
2. Audience targeting
3. Production quality and style
4. Engagement patterns
5. Monetization approach

After your analysis, critique your own response: Did you miss any non-obvious insights? Are you making assumptions without evidence?

Adopt the persona of an expert who's analyzed 1000+ channels and can spot patterns invisible to casual observers.

Các cụm từ "Think step-by-step", "critique your own response", và "adopt the persona of an expert" nhất quán tạo ra các phân tích sâu hơn, sâu sắc hơn. Một phân tích đã xác định pattern lịch nội dung của đối thủ cạnh tranh (họ đăng video sản phẩm vào thứ Hai, nội dung giải trí vào thứ Năm) mà một alpha tester đã sử dụng để điều chỉnh chiến lược của họ. Họ giờ là khách hàng trả phí.

10. Chia để trị

Khi tôi quyết định thêm "full channel analysis" vào TaffySearch, tôi gần như phá vỡ mọi thứ khi cố làm trong một prompt.

Cách tiếp cận ban đầu:

Analyze this entire YouTube channel (237 videos) and tell me what content performs best.

Điều này timeout, crash, hoặc trả về insights bề mặt.

Cách tiếp cận chia để trị:

Giai đoạn 1: Thu thập dữ liệu

For this YouTube channel, extract key metrics from each video:
- Title
- Views
- Upload date
- Video length
- Likes/comments ratio
- Transcription availability

Return as JSON array. Process in batches of 50 videos.

Giai đoạn 2: Nhận dạng pattern

Given this dataset of 237 videos with their metrics, identify:
- Top 10 performing videos (by views and engagement)
- Content themes that correlate with high performance
- Upload patterns (day of week, time, frequency)
- Title patterns in top performers
- Video length sweet spot

Return findings with statistical confidence levels.

Giai đoạn 3: Phân tích nội dung (chỉ trên top performers)

Now analyze the transcripts of these 10 top-performing videos. Identify:
- Common opening hooks
- Content structure patterns
- Topic angles that resonate
- Engagement trigger points (where people comment most)
- Call-to-action styles

Giai đoạn 4: Tổng hợp

Based on the quantitative analysis and qualitative content review, create an actionable content strategy report for this creator. 

Include:
- 5 proven content formats they should replicate
- 3 underutilized opportunities in their niche
- Optimal posting schedule
- Title/thumbnail patterns to test
- Specific content ideas based on what works

Format as an executive summary + detailed recommendations.

Cách tiếp cận modular này có nghĩa:

  • Tôi có thể cache các giai đoạn trước (tiết kiệm tokens khi re-run)
  • Failures chỉ ảnh hưởng một giai đoạn
  • Tôi có thể cải thiện từng phần riêng lẻ mà không cần xây dựng lại mọi thứ
  • Xử lý 237 videos từ "crashes" thành "30 giây"

Một alpha tester đã sử dụng phân tích này để xác định rằng video tutorials (8-12 phút) của họ nhận được engagement cao gấp 3 lần so với nội dung long-form (30+ phút). Họ đã pivot toàn bộ chiến lược, và kênh của họ giờ tăng trưởng nhanh hơn 4 lần. Một lần chuyển đổi sang trả phí nữa.

Kết quả thực tế (Với số liệu)

Để tôi cho bạn thấy tác động thực tế trên cả ba sản phẩm alpha của tôi sau khi triển khai các kỹ thuật này:

TaffySearch:

  • Độ chính xác trích xuất lead: 62% → 94% (đo bằng feedback người dùng về chất lượng kết quả)
  • Chi phí API trung bình mỗi phân tích: $0.12 → $0.04 (giảm 67%)
  • Token usage mỗi phân tích video: ~8,500 tokens → ~2,800 tokens
  • Phàn nàn của alpha tester về "bad results": Gần như mọi session → Có thể 1 trong 20
  • Tốc độ feature: Tôi ship 4 features mới trong 6 tuần
  • Testimonial alpha tester: "Cái này đã chuyển từ 'ý tưởng thú vị' sang 'tôi thực sự dùng cái này hàng tuần'"
  • Chuyển đổi từ dùng thử miễn phí sang trả phí: 3 trong 15 testers đầu tiên đã đăng ký

Sena (AI Networking Connector):

  • Mức độ liên quan của gợi ý kết nối (đánh giá của người dùng): 6.2/10 → 8.7/10
  • Thời gian response trung bình: 4.5s → 1.8s (prompts tốt hơn = ít tokens hơn = nhanh hơn)
  • Token usage mỗi batch kết nối: ~1,000 tokens → ~180 tokens (giảm 82%)
  • Feedback phổ biến nhất thay đổi từ "gợi ý có khi trúng khi trật" sang "làm sao cái này hiểu mình như vậy?"
  • Sử dụng lặp lại: Hầu hết testers dùng một lần → Giờ dùng cho mọi event họ tham dự

Recmend (Theo dõi dinh dưỡng qua ảnh):

  • Độ chính xác nhận dạng thực phẩm: 73% → 96% (xác minh với các corrections của người dùng)
  • Phàn nàn ước tính dinh dưỡng: Gần như liên tục → Chỉ còn các edge cases lẻ tẻ
  • Retention người dùng sau tuần đầu: 34% → 58%
  • Số bữa ăn được log trung bình mỗi ngày: 1.2 → 2.8 (người dùng tin tưởng dữ liệu đủ để track nhiều hơn)
  • Token usage mỗi phân tích ảnh: ~1,200 tokens → ~450 tokens (giảm 62%)

Tác động kinh doanh tổng thể:

  • Chi phí API kết hợp: ~$720/tháng → ~$240/tháng (giảm 67%, hoặc tiết kiệm khoảng $480/tháng)
  • Tốc độ phát triển: 2 features/tháng → 7 features/tháng trên tất cả sản phẩm
  • Thời gian support: 8 giờ/tuần → 3 giờ/tuần (ít phàn nàn về chất lượng AI hơn)
  • Tổng alpha testers: 47 trên ba sản phẩm

Tiết kiệm sáu tháng chỉ từ giảm chi phí API: ~$2,880. Vậy tôi không chỉ thu hồi $748 chi tiêu lãng phí. Tôi thực sự đi trước, và các sản phẩm hoạt động đủ ổn định để tôi tự tin onboard thêm người dùng.

Tại sao điều này quan trọng ngoài việc tiết kiệm chi phí

Đây là điều tôi không mong đợi: prompts tốt hơn thay đổi cách tôi nghĩ về phát triển sản phẩm.

Trước đây, mỗi feature cảm giác như tung xúc xắc. "Liệu cái này có hoạt động không? Nó có hallucinate không? Khách hàng có phàn nàn không?" Tôi dành hàng tuần xây dựng safety nets, fallbacks, human-in-the-loop systems.

Sau khi thành thạo prompt engineering, AI trở nên có thể dự đoán được. Bây giờ tôi có thể:

Ship features nhanh hơn: Tôi prototype tính năng "content framework extractor" của TaffySearch trong 4 giờ thay vì 4 tuần vì tôi biết chính xác cách prompt để có output nhất quán.

Đưa ra lời hứa táo bạo: Tagline của Sena từng là "AI-powered networking suggestions." Chung chung. Giờ là "Connect with exactly who you need to meet." Tôi có thể đưa ra lời hứa đó vì tôi kiểm soát chất lượng output của AI.

Cạnh tranh với các công ty lớn hơn: Tôi là một solopreneur bootstrap với ngân sách API $240/tháng cạnh tranh với các công ty được VC-backed chi $50K+/tháng. Nhưng chất lượng output AI của tôi tương đương hoặc tốt hơn vì tôi engineer mọi single prompt một cách ám ảnh. Lợi thế của tôi không phải resources — mà là sự chính xác.

Thực sự xây dựng sản phẩm AI: Điều này nghe có vẻ hiển nhiên, nhưng hầu hết sản phẩm AI chỉ là wrappers quanh base models với prompt engineering tối thiểu. Giờ tôi đang xây dựng giá trị thực trên đó. Các prompts/evals của tôi là product moat.

Bí mật bẩn thỉu của sản phẩm AI: model ít quan trọng hơn prompt. Ai cũng có quyền truy cập vào cùng GPT-4, Claude, hoặc Gemini. Lợi thế cạnh tranh của bạn là biết cách sử dụng nó.

Cách áp dụng điều này vào sản phẩm của bạn ngay bây giờ

Bạn không cần triển khai cả 10 kỹ thuật cùng lúc. Đây là thứ tự ưu tiên dựa trên những gì di chuyển metrics nhanh nhất cho tôi:

Tuần 1: Sửa prompt tệ nhất của bạn

  1. Tìm prompt có output không nhất quán nhất
  2. Áp dụng kỹ thuật #2 (Nguyên tắc rõ ràng)
  3. Thêm boundaries (kỹ thuật #3)
  4. Đo kết quả

Tuần 2: Thêm cấu trúc

  1. Xác định prompts cần structured data
  2. Thêm JSON schemas (kỹ thuật #5)
  3. Thêm ví dụ output
  4. Test với real data

Tuần 3: Multi-stage cho tác vụ phức tạp

  1. Tìm features phức tạp nhất của bạn
  2. Chia thành stages (kỹ thuật #4 và #10)
  3. Build pipeline
  4. Cache intermediate results

Tuần 4: Thêm power phrases

  1. Review analytical prompts
  2. Thêm "Think step-by-step"
  3. Thêm "critique your own response"
  4. Measure quality improvements

Tôi dành 6 tuần làm điều này có hệ thống trên ba sản phẩm. Bạn có thể làm nhanh hơn nếu tập trung vào một sản phẩm.

Các templates bạn có thể "ăn cắp"

Đây là năm prompt templates được sử dụng nhiều nhất của tôi trên tất cả sản phẩm. Hãy điều chỉnh chúng:

Template 1: Trích xuất dữ liệu có cấu trúc

Extract [specific data types] from [source].

Return as JSON:
{
  "[field1]": type,
  "[field2]": type,
  "[nested_object]": {
    "[subfield]": type
  }
}

CONSTRAINTS:
- Only return valid JSON
- Include "[specific_field]" only if confidence is high
- If [field] is unclear, set value to null and add to "uncertainty_flags" array

Return ONLY the JSON object, no explanatory text.

Template 2: Tạo nội dung cho người dùng

Generate [content type] for [audience].

CONTEXT: [Why they need this, what they'll use it for]

Use this exact format:
[Template structure with placeholders]

CONSTRAINTS:
- Maximum [X] words per section
- Tone: [specific description]
- Must include: [required elements]
- Must avoid: [banned elements, phrases, patterns]

Example of desired output:
[Paste actual example]

Template 3: Phân tích và insights

Act as [specific expert role with clear expertise].

Analyze [source] and identify [specific insights].

APPROACH:
1. [First thing to look for]
2. [Second thing to look for]
3. [Third thing to look for]

Return findings in this structure:
- Key Finding 1: [insight] (Evidence: [specific proof])
- Key Finding 2: [insight] (Evidence: [specific proof])
- Unexpected Pattern: [non-obvious discovery]

Think step-by-step through the data before drawing conclusions.

Critique your analysis: Are you making assumptions without evidence? What did you miss?

Template 4: So sánh và đề xuất

Compare [A] and [B] to help [user type] decide [decision].

CONTEXT: [What they're trying to achieve, what matters to them]

Analyze across these dimensions:
- [Dimension 1]
- [Dimension 2]
- [Dimension 3]

Return as a comparison table:
| Criteria | [A] | [B] | Winner |
|----------|-----|-----|--------|
| [Criterion] | [score/description] | [score/description] | [clear winner or tie] |

Then provide a one-paragraph recommendation based on [user's specific goal].
Avoid generic statements like "it depends" — make a clear recommendation with caveats.

Template 5: Tác vụ phức tạp nhiều giai đoạn

Stage 1: Create an outline for [complex deliverable]
- [Structure requirement 1]
- [Structure requirement 2]
- [Structure requirement 3]

Return outline only, wait for approval before proceeding.

---

[After outline approval]

Stage 2: Develop [specific section]
- [Detailed requirements]
- [Examples to include]
- [Depth level]

Return this section only.

---

[After section review]

Stage 3: Complete remaining sections using the approved format

Stage 4: Review complete deliverable
- Check for: [consistency check 1], [consistency check 2]
- Verify: [requirement 1], [requirement 2]
- Critique: [potential issue to watch for]

Return final polished version.

Điều tôi ước mình biết sáu tháng trước

Nếu làm lại từ đầu, tôi sẽ:

  1. Đầu tư vào prompt engineering từ ngày 1, không phải sau 6 tháng thất vọng
  2. Xây dựng prompt library trước khi xây dựng features
  3. Test prompts với edge cases trước khi ship
  4. Track token usage và chất lượng output từ đầu
  5. Đọc tài liệu của Anthropic trước (nó miễn phí!)
  6. Tập trung vào một sản phẩm thay vì ba (học nhanh hơn)
  7. Nói chuyện với người dùng về chất lượng AI sớm hơn
  8. Xây dựng feedback loops để liên tục cải thiện prompts
  9. Không sợ viết prompts dài (ROI là xứng đáng)
  10. Nhớ rằng AI là công cụ, không phải phép màu — bạn phải học cách sử dụng nó

Sai lầm mà hầu hết AI builders mắc phải

Họ đọc cái này. Họ gật đầu. Họ nói "có lý." Rồi họ quay lại sản phẩm của mình và... viết đúng những prompts lười biếng như cũ.

Tại sao? Vì nó cảm giác như công việc thêm trước mắt.

Đây là sự thật: dành 30 phút engineering một prompt tiết kiệm cho bạn 30 giờ debugging, xử lý edge cases, và sửa complaints của khách hàng.

Tôi biết vì tôi đã làm theo cách khó. Tôi dành 6 tháng chiến đấu với AI outputs không nhất quán trước khi học những kỹ thuật này. Đó là 6 tháng:

  • Feedback alpha tester về "weird results"
  • Lo lắng kiểm tra hóa đơn API
  • Xin lỗi người dùng đầu tiên
  • Rebuild features đáng lẽ phải hoạt động ngay từ lần đầu

Ba mươi phút prompt engineering sẽ ngăn chặn tất cả.

Bước tiếp theo của bạn

Đây là những gì tôi muốn bạn làm trong 48 giờ tới:

Ngày 1:

  1. Tìm prompt tệ nhất của bạn (output không nhất quán nhất)
  2. Áp dụng kỹ thuật #2 (Nguyên tắc rõ ràng)
  3. Thêm boundaries từ kỹ thuật #3
  4. Test với 10 inputs

Ngày 2:

  1. Đo kết quả (chất lượng, tokens, chi phí)
  2. So sánh với prompt cũ
  3. Document những gì hoạt động
  4. Chuyển sang prompt tệ thứ hai

Chỉ vậy thôi. Đừng cố sửa mọi thứ cùng lúc. Sửa một prompt, xem kết quả, tạo momentum.

Kết luận chính

Cho AI product builders:

  • Lợi thế cạnh tranh của bạn không phải model bạn sử dụng. Mà là bạn sử dụng nó tốt như thế nào
  • Prompts tốt hơn = chi phí thấp hơn + features tốt hơn + khách hàng hạnh phúc hơn
  • Prompt engineering là kỹ năng có thể học với ROI có thể đo lường
  • Bắt đầu với một prompt, không phải toàn bộ sản phẩm

Kỹ thuật cụ thể cần triển khai hôm nay:

  • Thêm tính rõ ràng: động từ hành động + số lượng + đối tượng (kỹ thuật #2)
  • Xác định ranh giới: độ dài, format, inclusions, exclusions (kỹ thuật #3)
  • Yêu cầu JSON output cho bất kỳ structured data nào (kỹ thuật #5)
  • Chia features phức tạp thành stages (kỹ thuật #10)
  • Thêm "Think step-by-step" vào analytical prompts (kỹ thuật #9)

Thành công trông như thế nào:

  • Giảm 50-80% chi phí API trong 30 ngày
  • Cải thiện 2-3 lần tính nhất quán của output
  • Ít complaints từ alpha testers về chất lượng AI
  • Phát triển feature nhanh hơn (bạn sẽ biết cách build đúng ngay lần đầu)
  • Tự tin onboard thêm người dùng mà không scale chi phí tương ứng

Bài học lớn nhất của tôi: Sự khác biệt giữa một AI wrapper và một sản phẩm AI là prompt engineering. Ai cũng có thể gọi một API. Xây dựng thứ gì đó mà alpha testers tin tưởng đủ để trở thành khách hàng trả phí đòi hỏi phải thành thạo cách giao tiếp với API đó. Điều này đặc biệt đúng khi bạn bootstrap và mỗi tương tác người dùng đều có giá trị.

Cơ hội thực sự: Hầu hết AI founders vẫn đang viết prompts tệ. Nếu bạn triển khai 10 kỹ thuật này, bạn sẽ có output tốt hơn các công ty được VC-backed chi gấp 50 lần những gì bạn chi. Là một builder bootstrap, đây là lợi thế không công bằng của bạn. Họ có tiền. Bạn có sự chính xác.

Điều tôi đang làm tiếp theo: Tôi hiện đang áp dụng những kỹ thuật này cho một tính năng mới trong TaffySearch: tự động tạo YouTube video scripts từ phân tích đối thủ cạnh tranh. Sáu tháng trước, tôi thậm chí không dám thử — quá rủi ro với AI không thể đoán trước. Bây giờ? Tôi biết chính xác cách prompt cho nó, và có lẽ tôi sẽ ship nó cho alpha testers của mình vào tuần tới. Sự tự tin đó là tất cả.

Đó là unlock thực sự: tự tin xây dựng các features AI tham vọng vì bạn có thể kiểm soát output.

Nếu bạn đang xây dựng sản phẩm AI và bạn thất vọng với kết quả không nhất quán, đốt tiền API, hoặc dành hàng tuần debugging hành vi AI — bạn không có vấn đề về model. Bạn có vấn đề về prompt.

Sửa prompts của bạn, sửa sản phẩm của bạn.

Tôi học điều này theo cách đắt tiền ($748 lãng phí, 6 tháng mất mát). Học nó theo cách dễ dàng: triển khai 10 kỹ thuật này trong tuần này.

Hóa đơn API của bạn sẽ cảm ơn bạn. Alpha testers của bạn sẽ cảm ơn bạn.

Và bạn cuối cùng sẽ ngừng sợ những gì AI có thể làm.

Giờ hãy đi sửa prompt tệ nhất đó.

Theo dõi trên X

Arun Agrahri|@arunagrahri

Bài đăng liên quan