# llms.txt

# Questo è un ipotetico file llms.txt che rispecchia le direttive di robots.txt.
# IMPORTANTE: non esiste uno standard ufficiale per llms.txt riconosciuto da tutti i fornitori di LLM,
# e questo file non può essere caricato direttamente sul vostro negozio Shopify senza ricorrere a soluzioni alternative.
# Serve come esempio di come potrebbero essere strutturate tali direttive.

# Regole generali per i bot LLM (equivalenti a User-agent: * in robots.txt)
User-agent: *LLM* # Rappresenta qualsiasi crawler Large Language Model
Disallow: /admin
Disallow: /cart
Disallow: /checkout
Disconoscimento: /checkouts/
Disconoscimento: /ordini
Disconoscimento: /account
Disconoscimento: /carts
Disallow: /*?oseid=
Disconoscimento: /*preview_theme_id
Disconoscimento: /*preview_script_id
Disconoscimento: /apple-app-site-association
Disallow: /.well-known/shopify/monorail
Disallow: /cdn/wpm/*.js
Disallow: /raccomandazioni/prodotti

# Questi sono consentiti per l'indicizzazione LLM (NON BLOCCARE):
Consenti: /collezioni/
Consenti: /prodotti/
Consenti: /blog/
Consentire: /pagine/
Consenti: /search # incl. contenuti ordinati, filtrati e taggati

# Direttiva LLM specifica di Google
User-agent: Google-Extended # Bot ufficiale utilizzato da Google per i modelli Gemini/Bard
Disallow: /admin/
Consenti: /

# Modelli basati su GPT di OpenAI (ChatGPT, ecc.)
Agente utente: GPTBot
Disallow: /admin/
Consenti: /

# Ipotetico bot LLM per contenuti pubblicitari
User-agent: AdLLMBot
Disallow: /checkout
Disallow: /checkout/
Disallow: /carts
Disconoscimento: /ordini

# Ipotetico bot LLM per l'elaborazione delle immagini (ad esempio, per la futura indicizzazione dei modelli visivi)
User-agent: ImageLLMBot
Disallow: /admin/
Consenti: /

# Ipotetico bot LLM per Pinterest
User-agent: PinterestLLM
Ritardo di crawl: 1

# Bot ipotetici LLM per Ahrefs
User-agent: AhrefsLLMBot
Ritardo di crawl: 10
Disallow: /checkout
Disallow: /checkout/
Disconoscimento: /cart
Disconoscimento: /admin
Disconoscimento: /ordini

User-agent: AhrefsSiteAuditLLM
Ritardo di crawl: 10
Disallow: /checkout
Disallow: /checkout/
Disconoscimento: /cart
Disconoscimento: /admin
Disconoscimento: /ordini

# Bot ipotetico di LLM per MJ12bot
Agente utente: MJ12LLMBot
Ritardo di strisciamento: 10

# Blocca gli scrapers LLM obsoleti o aggressivi
User-agent: OutdatedLLMScraper
Disallow: /

# I migliori usi per un ipotetico file llm.txt:
# 1. Privacy e sicurezza dei dati: Impedire ai crawler LLM di accedere ad aree sensibili.
# 2. Controllo dei contenuti per l'addestramento dell'intelligenza artificiale: Consentire/rifiutare esplicitamente i contenuti per l'addestramento dei modelli di intelligenza artificiale.
# 3. Gestione delle risorse: Potenzialmente mitigare il carico del server richiedendo ritardi nel crawl.
# 4. Protezione della proprietà intellettuale: Segnalare le preferenze di utilizzo dei contenuti.
# 5. Direttive mirate: Applicare regole specifiche a diversi agenti utente di LLM.