LangGraph中的Router使用场景#

1. Router的基本概念#

在LangGraph中，我们可以利用”条件边”这一概念来指导或约束大模型在处理特定任务时的逻辑流程。这种机制允许大模型在达到某一环节并满足预设条件时，根据不同的条件输出或数据，选择性地执行不同的逻辑路径。

条件边路由机制

为了管理这样复杂的图结构，LangGraph使用的是一个类似于 if-else语句的结构组件，称为Router（路由）。这个组件允许大模型从一组预设的选项中选择合适的步骤来进行执行。

1.1 简单边 vs 条件边#

对于简单的直接从节点A到节点B，我们一直使用的是add_edge方法：

1
from langgraph.graph import START, StateGraph, END
2

3
def node_a(state):
4
    return {"x": state["x"] + 1}
5

6
def node_b(state):
7
    return {"x": state["x"] - 2}
8

9
builder = StateGraph(dict)
10

11
builder.add_node("node_a", node_a)
12
builder.add_node("node_b", node_b)
13

14
# 构建节点之间的边
15
builder.add_edge(START, "node_a")
16
builder.add_edge("node_a", "node_b")
17
builder.add_edge("node_b", END)
18

19
graph = builder.compile()

如果想选择性地路由到 1 个或多个边，则需要使用add_conditional_edges方法。该方法在Graph的基类中进行了定义：

1
def add_conditional_edges(
2
    self,
3
    source: str,    # 起始节点
4
    path: Union[    # 这是一个可调用对象，其返回值决定接下来执行的节点
5
        Callable[..., Union[Hashable, list[Hashable]]],
6
        Callable[..., Awaitable[Union[Hashable, list[Hashable]]]],
7
        Runnable[Any, Union[Hashable, list[Hashable]]],
8
    ],
9
    path_map: Optional[Union[dict[Hashable, str], list[str]]] = None,  # 路径到节点名称的可选映射
10
    then: Optional[str] = None,  # 在path选择的节点之后执行的节点的名称
11
) -> Self:

1.2 路由函数的使用#

路由函数routing_function接受图的当前state并返回一个值，根据返回值的不同，来决定路由到哪个节点：

1
def routing_function(state):
2
    if state["x"] == 10:
3
        return "node_b"
4
    else:
5
        return "node_c"
6

7
builder.add_conditional_edges("node_a", routing_function)

默认情况下，routing_function路由函数的返回值用作将状态发送到下一个节点的名称。除此之外，还可以使用path_map参数，通过一个字典的数据结构将routing_function的输出映射到下一个节点的名称：

1
def routing_function(state):
2
    if state["x"] == 10:
3
        return True
4
    else:
5
        return False
6

7
builder.add_conditional_edges(
8
    "node_a",
9
    routing_function,
10
    {True: "node_b", False: "node_c"}
11
)

2. Router的实际应用场景#

一般来说，Agent是可以接收各种形式的输入，并通过预设的路由逻辑来确定执行的具体操作。如图所示，Agent的开始节点（Start）接收输入数据，这些输入可以是查询请求（例如”name: muyu, age: 18, phone: 123”或”Hello”）。根据输入的不同，流程通过Router函数进行决策，将不同的输入引导到正确的处理流程。

Router应用场景

这里的核心是Router function，它根据输入数据的结构和内容，动态地决定下一步应该执行的节点。例如，对于具体的查询请求，Router决定需要访问数据库（Mysql节点），而对于简单的问候（如”Hello”），则直接返回一个响应（Response节点）。

关键要点：

在构建实际的Agent时，Router function的定义才是最关键且最重要的
我们需要在这个函数中，基于特定的一些格式或者标识来区分该执行哪一条分支的逻辑
对于消息的传递，大模型往往是通过结构化输出，引导其在响应的过程中应遵循哪种模式来工作，就类似于工具调用过程
Router就很好的利用到了这个特性，通过结构化输出的特性来控制接下来的分支路径

3. 结构化输出的实现方式#

在LangGraph中，实现结构化输出可以通过以下三种有效方式完成：

提示工程：指示大模型以特定格式做出回应
输出解析器：采用后处理的方法从大模型的响应中提取结构化数据
工具调用：利用一些内置工具调用功能来生成结构化输出

3.1 提示工程方法#

直接通过提示工程让大模型生成特定格式的输出：

1
from langchain_core.prompts import ChatPromptTemplate
2
from langchain_openai import ChatOpenAI
3

4
llm = ChatOpenAI(model="gpt-4o-mini")
5

6
prompt = ChatPromptTemplate.from_messages(
7
    [
8
        (
9
            "system",
10
            "Answer the user query. Wrap the output in `json`",
11
        ),
12
        ("human", "{query}"),
13
    ]
14
)
15

16
chain = prompt | llm
17
ans = chain.invoke({"query": "我叫Hygen，今年18岁，邮箱地址是ciallo@gmial.com，电话是01000721"})

直接通过提示工程让大模型生成特定格式的输出虽然是可行的，但这种方法在复杂的Agent构建流程中非常并不稳定。

3.2 提示工程 + 输出解析器#

引入后处理步骤，通过输出解析器来格式化大模型生成的响应，可以提高输出的准确性和一致性：

1
from langchain_core.messages import AIMessage
2
import json
3
import re
4
from typing import List
5

6
def extract_json(message: AIMessage) -> List[dict]:
7
    """Extracts JSON content from a string where JSON is embedded between ```json and ``` tags."""
8
    text = message.content
9
    pattern = r"\`\`\`json(.*?)\`\`\`"
10
    matches = re.findall(pattern, text, re.DOTALL)
11
    try:
12
        return [json.loads(match.strip()) for match in matches]
13
    except Exception:
14
        raise ValueError(f"Failed to parse: {message}")
15

16
chain = prompt | llm | extract_json
17
ans = chain.invoke({"query": "我叫Hygen，今年18岁，邮箱地址是ciallo@gmial.com，电话是01000721"})

3.3 内置工具方法（推荐）#

在LangGraph中我们更常用的，且效果更好的是，直接使用其内置的工具方法：.with_structured_output()。

这个方法通过接受一个定义了所需输出属性的名称、类型和描述的模式作为输入，进而生成一个类似模型的 Runnable。不同于常规模型输出字符串或消息，这个 Runnable 输出一个与输入模式相匹配的对象。

可以通过几种方式指定这种架构，包括 TypedDict 类、JSON Schema 或 Pydantic 类。如果采用 TypedDict 或 JSON Schema，Runnable 将输出一个字典；若使用 Pydantic 类，则输出一个 Pydantic 对象。

4. 使用Pydantic做结构化输出#

使用Pydantic去限定输出格式，可以确保所有通过此模型处理的数据都会符合指定的结构和数据类型，从而减少数据处理中的错误并增加代码的健壮性。此外，Pydantic的验证系统还会自动确保所有字段都符合预定义的格式，如果输入数据不符合预期，则会抛出错误。

4.1 定义Pydantic模型#

1
from typing import Optional
2
from pydantic import BaseModel, Field
3

4
# 定义 Pydantic 模型
5
class UserInfo(BaseModel):
6
    """Extracted user information, such as name, age, email, and phone number, if relevant."""
7
    name: str = Field(description="The name of the user")
8
    age: Optional[int] = Field(description="The age of the user")
9
    email: str = Field(description="The email address of the user")
10
    phone: Optional[str] = Field(description="The phone number of the user")

在这个UserInfo模型中：

name（必需）: 存储用户的名字
age（可选）: 存储用户的年龄，这是一个可选字段
email（必需）: 存储用户的电子邮件地址
phone（可选）: 存储用户的电话号码，这也是一个可选字段

4.2 使用with_structured_output#

对于.with_structured_output()方法，如果我们希望模型返回一个 Pydantic 对象，只需要传入所需的 Pydantic 类即可：

1
import os
2
from langchain_openai import ChatOpenAI
3

4
os.environ["OPENAI_API_KEY"] = "sk-xxx" # 更换为自己的api-key
5

6
llm = ChatOpenAI(
7
  base_url="https://api.deepseek.com/v1",
8
  model="deepseek-chat",
9
  temperature=0
10
)
11

12
# 使用 function_calling 方法，兼容更多模型
13
structured_llm = llm.with_structured_output(UserInfo, method="function_calling")
14
extracted_user_info = structured_llm.invoke("我叫Hygen，今年18岁，邮箱地址是ciallo@gmial.com，电话是01000721")
15
print(extracted_user_info)

运行结果：

1
name='Hygen' age=18 email='ciallo@gmial.com' phone='01000721'

它返回的是一个UserInfo的Pydantic对象，每个字段中则填充了在原始非结构化文本中提取出来的结构化信息。

4.3 在Router Function中使用#

经过这样的格式化输出，对于Router function中，我们就可以通过类似这样的伪代码去继续路由分支的选择：

1
if isinstance(extracted_user_info, UserInfo):
2
    print("执行节点A的逻辑")
3
else:
4
    print("执行节点B的逻辑")

这就是结构化输出对于LangGraph中路由函数逻辑判断的意义所在。

5. 使用TypedDict做结构化输出#

如果不想使用 Pydantic去明确地验证输出参数，则可以使用 TypedDict 类定义结构化输出的模式。这就可以使用特殊Annotated语法，添加对指定字段的默认值和描述：

1
from typing import Optional
2
from typing_extensions import Annotated, TypedDict
3

4
# 定义 TypedDict 模型
5
class UserInfo(TypedDict):
6
    """Extracted user information from text"""
7
    name: Annotated[str, ..., "The user's name"]
8
    age: Annotated[Optional[int], None, "The user's age"]
9
    email: Annotated[str, ..., "The user's email address"]
10
    phone: Annotated[Optional[str], None, "The user's phone number"]
11

12
structured_llm = llm.with_structured_output(UserInfo, method="function_calling")
13
extracted_user_info = structured_llm.invoke("我叫Hygen，今年18岁，邮箱地址是ciallo@gmial.com，电话是01000721")

使用 TypedDict 创建的”对象”实际上是一个字典。它没有Pydantic模型那样的方法和属性，因此功能相对简单。TypedDict 主要用于静态类型检查，但它不会在运行时进行类型检查，但搭配着LangGraph中已实现的基本验证机制，也是一种不错的方法。

6. 使用JSON Schema做结构化输出#

对于Json Schema格式大家应该最为熟悉，不需要导入或类，可以直接通过字典的形式清楚地准确记录每个参数，但代价是代码会更加冗长：

1
# 定义 JSON Schema
2
json_schema = {
3
    "title": "user_info",
4
    "description": "Extracted user information",
5
    "type": "object",
6
    "properties": {
7
        "name": {
8
            "type": "string",
9
            "description": "The user's name",
10
        },
11
        "age": {
12
            "type": "integer",
13
            "description": "The user's age",
14
            "default": None,
15
        },
16
        "email": {
17
            "type": "string",
18
            "description": "The user's email address",
19
        },
20
        "phone": {
21
            "type": "string",
22
            "description": "The user's phone number",
23
            "default": None,
24
        },
25
    },
26
    "required": ["name", "email"],
27
}
28

29
structured_llm = llm.with_structured_output(UserInfo, method="function_calling")
30
extracted_user_info = structured_llm.invoke("我叫Hygen，今年18岁，邮箱地址是ciallo@gmial.com，电话是01000721")

7. 结合结构化输出构建路由图#

三种不同的结构化输出方法，我们更常使用的是用Pydantic来处理路由决策。在这种策略下，我们可以通过定义一个包含Union类型属性的父模型来灵活地从多种模式中选择适当的路由分支。

7.1 定义Union类型的响应模型#

例如，如果我们想根据输出决定是查询数据库还是直接回答问题，可以创建一个统一的模型来封装可能的输出类型：

1
from typing import Union, Optional
2
from pydantic import BaseModel, Field
3

4
# 定义数据库插入的用户信息模型
5
class UserInfo(BaseModel):
6
    """Extracted user information, such as name, age, email, and phone number, if relevant."""
7
    name: str = Field(description="The name of the user")
8
    age: Optional[int] = Field(description="The age of the user")
9
    email: str = Field(description="The email address of the user")
10
    phone: Optional[str] = Field(description="The phone number of the user")
11

12
# 定义正常生成模型回复的模型
13
class ConversationalResponse(BaseModel):
14
    """Respond to the user's query in a conversational manner. Be kind and helpful."""
15
    response: str = Field(description="A conversational response to the user's query")
16

17
# 定义最终响应模型，可以是用户信息或一般响应
18
class FinalResponse(BaseModel):
19
    final_output: Union[UserInfo, ConversationalResponse]

这个扩展后的代码将用于提取和存储用户的基本信息的UserInfo模型与用于生成面向用户的交流响应的ConversationalResponse模型统一的放在了FinalResponse模型中，使用Union类型来支持灵活的输出选项。

7.2 构建完整的路由图#

7.2.1 定义节点函数#

首先，定义Pydantic模型以及用于生成格式化输出的大模型实例：

1
import os
2
from langchain_openai import ChatOpenAI
3

4
os.environ["OPENAI_API_KEY"] = "sk-xxx" # 输入自己的api-key
5

6
llm = ChatOpenAI(
7
  base_url="https://api.deepseek.com/v1",
8
  model="deepseek-chat",
9
  temperature=0
10
)

定义路由节点函数，将用户输入的文本转化成格式化输出：

1
def chat_with_model(state):
2
  """generate structured output"""
3
  messages = state['messages']
4
  structured_llm = llm.with_structured_output(FinalResponse, method="function_calling")
5
  response = structured_llm.invoke(messages)
6
  return {"messages": [response]}

连接数据库并创建表

1
from sqlalchemy import create_engine, Table, Column, Integer, String, MetaData, text
2
from sqlalchemy.orm import declarative_base, sessionmaker
3

4

5
# 创建基类
6
Base = declarative_base()
7

8
# 定义 UserInfo 模型
9
class User(Base):
10
  __tablename__ = 'users'
11
  id = Column(Integer, primary_key=True)
12
  name = Column(String(50))
13
  age = Column(Integer)
14
  email = Column(String(100))
15
  phone = Column(String(15))
16

17
# 数据库连接配置
18
# 格式：mysql+pymysql://用户名:密码@主机:端口/数据库名?charset=utf8mb4
19
# 本地连接说明：
20
# - 用户名：你的 MySQL 用户名（默认通常是 root）
21
# - 密码：你的 MySQL 密码
22
# - 主机：localhost 或 127.0.0.1（本地连接）
23
# - 端口：3306（MySQL 默认端口，如果使用默认端口可以省略）
24
# - 数据库名：要连接的数据库名称
25
# - charset=utf8mb4：设置字符集为 utf8mb4，支持更广泛的 Unicode 字符
26

27
# MySQL 连接信息（不包含数据库名，用于创建数据库）
28
MYSQL_USER = 'root'
29
MYSQL_PASSWORD = '123456'
30
MYSQL_HOST = 'localhost'
31
MYSQL_PORT = '3306'
32
DATABASE_NAME = 'langgraph_agent'
33

34
# 先连接到 MySQL 服务器（不指定数据库），用于创建数据库
35
server_uri = f'mysql+pymysql://{MYSQL_USER}:{MYSQL_PASSWORD}@{MYSQL_HOST}:{MYSQL_PORT}?charset=utf8mb4'
36
server_engine = create_engine(server_uri, echo=False)
37

38
# 创建数据库（如果不存在）
39
with server_engine.connect() as conn:
40
    conn.execute(text(f"CREATE DATABASE IF NOT EXISTS `{DATABASE_NAME}` CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci"))
41
    conn.commit()
42

43
# 连接到指定的数据库
44
DATABASE_URI = f'mysql+pymysql://{MYSQL_USER}:{MYSQL_PASSWORD}@{MYSQL_HOST}:{MYSQL_PORT}/{DATABASE_NAME}?charset=utf8mb4'
45
engine = create_engine(DATABASE_URI, echo=True)
46

47
# 如果表不存在，则创建表
48
Base.metadata.create_all(engine)
49

50
# 创建会话
51
Session = sessionmaker(bind=engine)
52
session = Session()

然后分别定义两个分支节点，其中final_answer用于直接生成响应，而insert_db用于执行数据库插入操作：

1
def final_answer(state):
2
  """generate natural language responses"""
3
  messages = state['messages'][-1]
4
  response = messages.final_output.response
5
  return {"messages": [response]}
6

7
def insert_db(state):
8
  """Insert user information into the database"""
9
  session = Session() # 确保为每次操作创建新的会话
10
  try:
11
    result = state['messages'][-1]
12
    output = result.final_output
13
    user = User(name=output.name, age=output.age, email=output.email, phone=output.phone)
14
    session.add(user)
15
    session.commit()
16
    return {"messages": [f"数据已成功存储至Mysql数据库。"]}
17
  except Exception as e:
18
    session.rollback()  # 出错时回滚
19
    return {"messages": [f"数据存储失败，错误原因：{e}"]}
20
  finally:
21
    session.close()  # 关闭会话

7.2.2 定义Router Function#

定义generate_branch函数作为Router Function，根据经过chat_with_model节点后产生的不同Pydantic对象，选择连接不同的节点：

1
from langchain_core.messages import AnyMessage
2
from typing_extensions import TypedDict, Annotated
3
import operator
4

5
class AgentState(TypedDict):
6
  messages: Annotated[list[AnyMessage], operator.add]
7

8
def generate_branch(state: AgentState):
9
  result = state['messages'][-1]
10
  output = result.final_output
11
  if isinstance(output, UserInfo):
12
    return True
13
  elif isinstance(output, ConversationalResponse):
14
    return False

7.2.3 构建图结构#

构建图并使用条件边来生成Router：

1
from langgraph.graph import StateGraph
2

3
graph = StateGraph(AgentState)
4

5
graph.add_node("chat_with_model", chat_with_model)
6
graph.add_node("final_answer", final_answer)
7
graph.add_node("insert_db", insert_db)
8

9
graph.set_entry_point("chat_with_model")
10

11
graph.add_conditional_edges(
12
  "chat_with_model",
13
  generate_branch,
14
  {True: "insert_db", False: "final_answer"}
15
)
16

17
graph.set_finish_point("final_answer")
18
graph.set_finish_point("insert_db")
19

20
graph = graph.compile()

7.2.4 测试路由图#

测试执行插入数据库的条件分支：

1
from langchain_core.messages import HumanMessage
2

3
query = "我叫Hygen，今年18岁，邮箱地址是ciallo@gmial.com，电话是01000721"
4
input_message = {"messages": [HumanMessage(content=query)]}
5
result = graph.invoke(input_message)
6
print(result)

运行结果：

1
{'messages': [HumanMessage(content='我叫Hygen，今年18岁，邮箱地址是ciallo@gmial.com，电话是01000721', additional_kwargs={}, response_metadata={}), FinalResponse(final_output=UserInfo(name='Hygen', age=18, email='ciallo@gmial.com', phone='01000721')), '数据已成功存储至Mysql数据库。']}

去查看本地数据库可以看到确实有新的数据插入：

数据库插入

而如果正常的问答，则会经过final_answer直接生成响应：

1
query = "你好，请你介绍一下你自己"
2
input_message = {"messages": [HumanMessage(content=query)]}
3
result = graph.invoke(input_message)
4
print(result)

运行结果：

1
{'messages': [HumanMessage(content='你好，请你介绍一下你自己', additional_kwargs={}, response_metadata={}), FinalResponse(final_output=ConversationalResponse(response='你好！我是一个AI助手，专门设计来帮助用户处理各种任务和回答问题。我可以协助您进行信息查询、文本处理、数据分析等
2
多种工作。如果您有任何需要帮助的地方，请随时告诉我，我会尽力为您提供支持！')), '你好！我是一个AI助手，专门设计来帮助用户处理各种任务和回答问题。我可以协助您进行信息查询、文本处理、数据分析等多种工作。如果您有任何需要帮助的地方，请随时告诉我，我会尽力为您提供支持！']}

8. Router Agent的优势与局限#

8.1 优势#

Router Agent（路由代理）的优势就是可以精准的控制程序链路中的每一个细节，通过预定义的分支结构，可以根据用户的输入请求灵活适配不同的场景。

在这个过程中，结构化输出对于路由至关重要，因为它们确保系统可以可靠地解释大模型的决定并采取行动。

8.2 局限#

同时，这也表现出来了这是一种相对有限的控制级别的代理架构，因为大模型通常只能控制单个决策。

想象一下上面的场景中，如果我们希望定义的insert_db不仅仅只是包含插入数据库，而是有一堆各式各样的工具，比如网络搜索，RAG等等，应该如何进一步的扩展呢？难道要做对每一个工具在insert_db节点下再通过Router Function做分支判断吗？虽然可行，但总归并不是高效的做法。

由此，我们接下来进一步介绍Tool Calling Agent（工具调用代理）来高效的解决这一问题。

9. 核心要点总结#

9.1 Router的核心机制#

条件边（Conditional Edges）：LangGraph使用add_conditional_edges方法实现条件路由
路由函数（Router Function）：接受当前状态，返回下一个节点的标识
路径映射（Path Map）：可选参数，将路由函数的返回值映射到节点名称

9.2 结构化输出的重要性#

三种实现方式：提示工程、输出解析器、工具调用（.with_structured_output()）
三种模式：Pydantic、TypedDict、JSON Schema
推荐使用：Pydantic + .with_structured_output()方法，效果最好且最稳定

9.3 路由图构建流程#

定义数据模型：使用Pydantic定义结构化输出模型
创建节点函数：包括路由节点和分支节点
定义Router Function：根据结构化输出判断路由方向
构建图结构：使用add_conditional_edges添加条件边
测试验证：使用不同输入测试路由逻辑

9.4 实践建议#

Router Function设计：这是最关键的部分，需要基于特定格式或标识来区分分支逻辑
结构化输出：充分利用大模型的结构化输出特性来控制分支路径
Union类型：使用Union类型支持多种输出模式，提高灵活性
逐步扩展：从简单的路由开始，逐步添加复杂的分支逻辑

10. 学习要点#

通过本节的学习，需要掌握：

✅ 理解Router的基本概念和条件边机制
✅ 掌握add_conditional_edges方法的使用
✅ 了解三种结构化输出的实现方式
✅ 熟练使用Pydantic、TypedDict、JSON Schema做结构化输出
✅ 能够结合结构化输出构建完整的路由图
✅ 理解Router Agent的优势与局限

注意：Router是LangGraph中实现智能路由决策的核心机制，结构化输出是Router Function实现的关键技术。掌握这些内容，是构建复杂AI Agent应用的重要基础。

Hygen's Blog

LangGraph中的Router使用场景#

1. Router的基本概念#

1.1 简单边 vs 条件边#

1.2 路由函数的使用#

2. Router的实际应用场景#

3. 结构化输出的实现方式#

3.1 提示工程方法#

3.2 提示工程 + 输出解析器#

3.3 内置工具方法（推荐）#

4. 使用Pydantic做结构化输出#

4.1 定义Pydantic模型#

4.2 使用with_structured_output#

4.3 在Router Function中使用#

5. 使用TypedDict做结构化输出#

6. 使用JSON Schema做结构化输出#

7. 结合结构化输出构建路由图#

7.1 定义Union类型的响应模型#

7.2 构建完整的路由图#

7.2.1 定义节点函数#

7.2.2 定义Router Function#

7.2.3 构建图结构#

7.2.4 测试路由图#

8. Router Agent的优势与局限#

8.1 优势#

8.2 局限#

9. 核心要点总结#

9.1 Router的核心机制#

9.2 结构化输出的重要性#

9.3 路由图构建流程#

9.4 实践建议#

10. 学习要点#