some langchain llm call

2026-04-10 10:15:37 +00:00
commit aaefaedaa3
11 changed files with 285 additions and 0 deletions
--- a/.env
+++ b/.env
@@ -0,0 +1,2 @@
+#GOOGLE_API_KEY = "AQ.Ab8RN6KVRupKRqWZACksBWw7MrClcfbyMXGjHPyOFMssOGxFFQ"
+GOOGLE_API_KEY = "AIzaSyAmitbNdx29t1uV3XYHdXpC55XCufAPM-g"
--- a/.gitignore
+++ b/.gitignore
@@ -0,0 +1 @@
+.venv/
--- a/agent.py
+++ b/agent.py
@@ -0,0 +1,49 @@
+import os
+from typing import Annotated
+from typing_extensions import TypedDict # Plus robuste pour le State
+
+from dotenv import load_dotenv
+from langgraph.graph import StateGraph, START, END
+from langgraph.graph.message import add_messages
+from langchain_google_vertexai import ChatVertexAI
+
+load_dotenv()
+
+# 1. Configuration du modèle (Syntaxe actuelle)
+# Assure-hui que GOOGLE_APPLICATION_CREDENTIALS ou GOOGLE_CLOUD_PROJECT est dans ton .env
+llm = ChatVertexAI(
+    model="gemini-1.5-flash",
+    temperature=0,
+)
+
+# 2. Définition de l'état
+# add_messages permet d'accumuler l'historique au lieu de l'écraser
+class State(TypedDict):
+    messages: Annotated[list, add_messages]
+
+# 3. Le nœud de l'agent
+def call_model(state: State):
+    response = llm.invoke(state["messages"])
+    # On retourne un dictionnaire qui sera mergé avec l'état actuel
+    return {"messages": [response]}
+
+# 4. Construction du graphe (Architecture actuelle)
+builder = StateGraph(State)
+
+builder.add_node("agent", call_model)
+
+builder.add_edge(START, "agent")
+builder.add_edge("agent", END)
+
+# Compilation
+graph = builder.compile()
+
+# 5. Exécution propre
+if __name__ == "__main__":
+    initial_state = {"messages": [("user", "Salut, tu tournes sur quelle version de Gemini ?")]}
+    
+    # Utilisation de .stream() pour voir ce qui se passe
+    for chunk in graph.stream(initial_state):
+        for node, values in chunk.items():
+            print(f"--- Node: {node} ---")
+            print(values["messages"][-1].content)
--- a/rag_import.py
+++ b/rag_import.py
@@ -0,0 +1,53 @@
+import os
+from dotenv import load_dotenv
+#from langchain_community.document_loaders import TextLoader
+from langchain_community.document_loaders import Docx2txtLoader
+from langchain_text_splitters import RecursiveCharacterTextSplitter
+from langchain_google_genai import GoogleGenerativeAIEmbeddings
+from langchain_qdrant import QdrantVectorStore
+
+# 1. Chargement de la clé API
+load_dotenv()
+api_key = os.getenv("GOOGLE_API_KEY")
+
+def inserer_documents():
+    print("1. Chargement du document...")
+    # Assurez-vous d'avoir un fichier mon_document.txt à côté de ce script
+    #loader = TextLoader("resources/cv.docx", encoding="utf-8")
+    loader = Docx2txtLoader("resources/cv.docx")
+    documents = loader.load()
+
+    
+    
+
+    print("2. Découpage du texte en morceaux...")
+    # On coupe le texte par blocs de 500 caractères, avec un chevauchement de 50 caractères
+    # (Le chevauchement évite de couper une phrase importante au milieu)
+    text_splitter = RecursiveCharacterTextSplitter(
+        chunk_size=500,
+        chunk_overlap=50
+    )
+    morceaux = text_splitter.split_documents(documents)
+    print(f"-> Le document a été découpé en {len(morceaux)} morceau(x).")
+
+    print("3. Connexion au modèle d'Embedding...")
+    # C'EST CRUCIAL : C'est le même modèle que dans votre script de recherche !
+    embeddings = GoogleGenerativeAIEmbeddings(model="models/gemini-embedding-001")
+
+    print("4. Envoi vers Qdrant...")
+    # On utilise la méthode "from_documents" qui va tout faire d'un coup :
+    # Créer la collection (si elle n'existe pas), vectoriser, et sauvegarder.
+    qdrant_url = "http://qdrant:6333" 
+    nom_collection = "rag-1"
+
+    QdrantVectorStore.from_documents(
+        documents=morceaux,
+        embedding=embeddings,
+        url=qdrant_url,
+        collection_name=nom_collection,
+    )
+    
+    print("✅ Succès ! Les données sont dans Qdrant.")
+
+if __name__ == "__main__":
+    inserer_documents()
--- a/rag_llm.py
+++ b/rag_llm.py
@@ -0,0 +1,76 @@
+import os
+from dotenv import load_dotenv
+from langchain_google_genai import ChatGoogleGenerativeAI, GoogleGenerativeAIEmbeddings
+from langchain_qdrant import QdrantVectorStore
+from qdrant_client import QdrantClient
+from langchain_classic.chains import create_retrieval_chain
+from langchain_classic.chains.combine_documents import create_stuff_documents_chain
+from langchain_core.prompts import ChatPromptTemplate
+
+# 1. Chargement de la clé API
+load_dotenv()
+api_key = os.getenv("GOOGLE_API_KEY")
+
+def interroger_mon_rag(question):
+    # --- A. CONFIGURATION DES MODÈLES ---
+    # Le modèle qui va générer la réponse
+    llm = ChatGoogleGenerativeAI(model="gemini-2.5-flash", google_api_key=api_key, temperature=0)
+    
+    # Le modèle qui transforme le texte en vecteurs (doit être le même que celui utilisé pour remplir la base)
+    embeddings = GoogleGenerativeAIEmbeddings(model="models/gemini-embedding-001")
+
+    # --- B. CONNEXION À QDRANT ---
+    # Remplacez l'URL par l'adresse de votre VM (ex: http://localhost:6333)
+    # Et mettez le vrai nom de votre collection Qdrant
+    qdrant_url = "http://qdrant:6333" 
+    nom_collection = "rag-1"
+
+    client = QdrantClient(url=qdrant_url)
+    
+    # On connecte LangChain à Qdrant
+    vector_store = QdrantVectorStore(
+        client=client,
+        collection_name=nom_collection,
+        embedding=embeddings
+    )
+    
+    # On transforme la base en "Retriever" (un outil qui va chercher les 3 meilleurs documents)
+    retriever = vector_store.as_retriever(search_kwargs={"k": 3})
+
+    # --- C. CRÉATION DU PROMPT RAG ---
+    # Le mot {context} sera automatiquement remplacé par les documents trouvés dans Qdrant
+    system_prompt = (
+        "Tu es un assistant utile. Utilise UNIQUEMENT les morceaux de contexte "
+        "fournis ci-dessous pour répondre à la question. Si tu ne connais pas la réponse "
+        "à partir du contexte, dis simplement que tu ne sais pas."
+        "\n\n"
+        "Contexte :\n{context}"
+    )
+    
+    prompt = ChatPromptTemplate.from_messages([
+        ("system", system_prompt),
+        ("human", "{input}"),
+    ])
+
+    # --- D. ASSEMBLAGE DE LA CHAÎNE ---
+    # 1. Chaîne qui combine les documents récupérés et le prompt
+    question_answer_chain = create_stuff_documents_chain(llm, prompt)
+    
+    # 2. Chaîne globale qui fait la recherche PUIS appelle la chaîne précédente
+    rag_chain = create_retrieval_chain(retriever, question_answer_chain)
+
+    # --- E. EXÉCUTION ---
+    print(f"Recherche de la réponse pour : '{question}'...\n")
+    reponse = rag_chain.invoke({"input": question})
+    
+    print("🤖 Réponse de Gemini :")
+    print(reponse["answer"])
+    
+    print("\n📄 Documents sources utilisés :")
+    for doc in reponse["context"]:
+        # Affiche un extrait du document source et ses métadonnées
+        print(f"- {doc.page_content[:100]}... (Source: {doc.metadata})")
+
+# Test du script
+if __name__ == "__main__":
+    interroger_mon_rag("Quelles sont les passions de vincent poupet ?")
--- a/12
+++ b/12
@@ -0,0 +1,12 @@
+langchain
+langchain_classic
+langchain_community
+langgraph
+langchain-google-vertexai
+langchain-core
+langchain-google-genai
+dotenv
+qdrant-client
+langchain-qdrant
+langchain-chain
+docx2txt
--- a/resources/cv.docx
+++ b/resources/cv.docx
--- a/simple_llm_call.py
+++ b/simple_llm_call.py
@@ -0,0 +1,30 @@
+import os
+from dotenv import load_dotenv
+from langchain_google_genai import ChatGoogleGenerativeAI
+
+
+# Charger les variables du fichier .env
+load_dotenv()
+api_key = os.getenv("GOOGLE_API_KEY")
+
+# 1. Configuration de la clé API
+# Remplacez 'VOTRE_CLE_API' par votre véritable clé
+#os.environ["GOOGLE_API_KEY"] = api_key
+
+def interroger_gemini(question):
+    # 2. Initialisation du modèle
+    # On choisit le modèle 'gemini-1.5-flash' pour sa rapidité
+    llm = ChatGoogleGenerativeAI(model="gemini-2.5-flash",google_api_key=api_key)
+
+    # 3. Appel du modèle
+    print(f"Question posée : {question}")
+    reponse = llm.invoke(question)
+    
+    # Affichage du contenu de la réponse
+    return reponse.content
+
+# Test du script
+if __name__ == "__main__":
+    resultat = interroger_gemini("Quels sont les 3 avantages d'apprendre Python ?")
+    print("\nRéponse de Gemini :")
+    print(resultat)
--- a/system_llm_call.py
+++ b/system_llm_call.py
@@ -0,0 +1,29 @@
+import os
+from dotenv import load_dotenv
+from langchain_google_genai import ChatGoogleGenerativeAI
+from langchain_core.prompts import ChatPromptTemplate
+
+# Charger les variables du fichier .env
+load_dotenv()
+api_key = os.getenv("GOOGLE_API_KEY")
+
+# Initialisation du modèle
+llm = ChatGoogleGenerativeAI(model="gemini-2.5-flash",google_api_key=api_key)
+
+def expert_en_codage(concept):
+    # 1. On définit un Template (le "moule" de la question)
+    prompt = ChatPromptTemplate.from_messages([
+        ("system", "Tu es un expert en programmation Python. Explique les concepts de manière simple avec un exemple de code court."),
+        ("human", "Explique-moi le concept suivant : {concept}")
+    ])
+
+    # 2. On crée une "chaîne" (Chain) simple
+    chain = prompt | llm
+
+    # 3. On lance la chaîne en remplissant la variable
+    reponse = chain.invoke({"concept": concept})
+    
+    print(reponse.content)
+
+# Test
+expert_en_codage("Les list comprehensions")
--- a/system_llm_stream.py
+++ b/system_llm_stream.py
@@ -0,0 +1,31 @@
+import os
+from dotenv import load_dotenv
+from langchain_google_genai import ChatGoogleGenerativeAI
+from langchain_core.prompts import ChatPromptTemplate
+
+# Charger les variables du fichier .env
+load_dotenv()
+api_key = os.getenv("GOOGLE_API_KEY")
+
+# Initialisation du modèle
+llm = ChatGoogleGenerativeAI(model="gemini-2.5-flash",google_api_key=api_key)
+
+def expert_en_codage(concept):
+    # 1. On définit un Template (le "moule" de la question)
+    prompt = ChatPromptTemplate.from_messages([
+        ("system", "Tu es un expert en programmation Python. Explique les concepts de manière simple avec un exemple de code court."),
+        ("human", "Explique-moi le concept suivant : {concept}")
+    ])
+
+    # 2. On crée une "chaîne" (Chain) simple
+    chain = prompt | llm
+       
+    # Au lieu de .invoke(), on utilise .stream()
+    # Cela retourne un générateur (itérable)
+    for chunk in chain.stream({"concept": concept}):
+        # Chaque 'chunk' est un morceau de la réponse
+        # On utilise end="" pour ne pas revenir à la ligne et flush=True pour forcer l'affichage
+        print(chunk.content, end="", flush=True)
+
+# Test
+expert_en_codage("Les variables")
--- a/test.py
+++ b/test.py
@@ -0,0 +1,2 @@
+import sys
+print("🔍 Le Python qui s'exécute actuellement est :", sys.executable)