pymssql 读写SQL Server数据库

作者：悦光阴时间：2023-08-25 阅读数：1463 人阅读分享到：

pymssql包是Python语言用于连接SQL Server数据库的驱动程序(或者称作DB API)，它是最终和数据库进行交互的工具。SQLAlchemy包就是利用pymssql包实现和SQL Server数据库交互的功能的。

一，pymssql包的基本组成
pymssql包由两个模块构成：pymssql 和 _mssql，pymssql 是建立在_mssql模块之上的模块，相对来说，_mssql性能更高。

pymssql模块由Connection和Cursor 两个大类构成：

Connection类代表MS SQL Sever数据库的一个连接，
Cursor类用于向数据库发送查询请求，并获取查询的的结果。
按照惯例，使用pymssql包查询数据库之前，首先创建连接：

import pymssql
conn = pymssql.connect(host='host',database='db_name',user='user',password='pwd',charset='utf8')

通过连接创建游标，通过游标执行SQL语句，查询数据或对数据进行更新操作：

cursor = conn.cursor()
cursor.execute("sql statement")

如果执行的是修改操作，需要提交事务；如果执行的是查询操作，不需要提交：

conn.commit()

在查询完成之后，关闭连接

conn.close()

二，连接
连接对象用于连接SQL Server引擎，并设置连接的属性，比如连接超时，字符集等。

1，创建连接对象

pymssql通过类函数来构建连接对，在创建连接对象的同时，打开连接：

class pymssql.Connection(user, password, host, database, timeout, login_timeout, charset, as_dict)

2，构建Cursor对象

在创建连接对象之后，创建Cursor对象，使用Cursor对象向数据库引擎发送查询请求，并获取查询的结果：

Connection.cursor(as_dict=False)

as_dict是布尔类型，默认值是False，表示返回的数据是元组(tuple)类型；如果设置为True，返回的数据集是字典(dict)类型。

3，提交查询和自动提交模式

在执行查询之后，必须提交当前的事务，以真正执行Cursor对象的查询请求：

Connection.commit()

默认情况下，自动提交模式是关闭的，用户可以设置自动提交，pymssql自动执行Cursor发送的查询请求：

Connection.autocommit(status)

status是bool值，True表示打开自动提交模式，False表示关闭自动提交模式，默认值是False。

4，关闭连接

在执行完查询之后，关闭连接，通常情况下，使用with 语句来自动关闭连接：

Connection.close()

三，Cursor对象
通过打开的连接对象来创建Cursor对象，通过Cursor对象向数据库引擎发送查询请求，并获取查询的结果。

1，执行查询

Cursor对象调用execute**()函数来执行查询请求，

Cursor.execute(operation)
Cursor.execute(operation, params)
Cursor.executemany(operation, params_seq)

参数注释：

operation：表示执行的sql语句，
params ：表示sql语句的参数，
params_seq：参数序列，用于sql语句包含多个参数的情况。
注意，除设置自动提交模式之外，必须在执行查询之后，通过连接对象来提交查询。

Connection.commit()

如果sql语句只包含一个参数，那么必须在sql语句中显式使用%s或%d作为占位符，分别用于引用字符型的参数和数值型的参数。

cursor.execute('SELECT * FROM persons WHERE salesrep=%s', 'John Doe')

如果sql语句包含多个参数，那么使用list来传递参数：

cursor.executemany(
"INSERT INTO persons VALUES (%d, %s, %s)",
[(1, 'John Smith', 'John Doe'),
(2, 'Jane Doe', 'Joe Dog'),
(3, 'Mike T.', 'Sarah H.')])

2，获取查询结果

Cursor对象调用fetch**()函数来获取查询的结果：

Cursor.fetchone()
Cursor.fetchmany(size=None)
Cursor.fetchall()

fetch**()函数是迭代的：

fetchone()：表示从查询结果中获取下一行(next row)
fetchmany()：表示从查询结果中获取下面的多行(next batch)
fetchall()：表示从查询结果中获取剩余的所有数据行(all remaining)
3，跳过结果集

当查询的结果包含多个结果集时，可以跳过当前的结果集，跳到下一个结果集：

Cursor.nextset()

如果当前结果集还有数据行未被读取，那么这些剩余的数据行会被丢弃。

四，使用Cursor对象查询数据
游标cursor是由连接创建的对象，可以在游标中执行查询，并设置数据返回的格式。当执行select语句获取数据时，返回的数据行有两种格式：元组和字典，行的默认格式是元组。

cursor = conn.cursor(as_dict=True)

pymssql返回的数据集的格式是在创建游标时设置的，当参数 as_dict为True时，返回的行是字典格式，该参数的默认值是False，因此，默认的行格式是元组。

由于游标是一个迭代器，因此，可以使用for语句以迭代方式逐行处理查询的结果集。

for row in cursor:

1，以元组方式返回数据行

默认情况下，游标返回的每一个数据行，都是一个元组结构：

cursor=connect.cursor()
cursor.execute('SELECT * FROM persons WHERE salesrep=%s', 'John Doe')
for row in cursor:
print('row = %r' % (row,))

2，以字典方式返回数据行

当设置游标以字典格式返回数据时，每一行都是一个字典结构：

cursor = conn.cursor(as_dict=True)
cursor.execute('SELECT * FROM persons WHERE salesrep=%s', 'John Doe')
for row in cursor:
print("ID=%d, Name=%s" % (row['id'], row['name']))

五，使用Cursor对象更新数据
在执行update、delete或insert命令对数据进行更新时，需要显式提交事务。

1，执行单条语句修改数据

当需要更新数据时，调用游标的execute()函数执行SQL命令来实现，可以以参数化的方式来执行，参数化类似于python的string.format()函数，通过格式化的字符串、占位符和参数来生成TSQL脚本。

cursor.execute(operation)
cursor.execute(operation, params)

通过游标的execute()函数来执行TSQL语句，调用 commit() 来提交事务

cursor.execute("sql statement")
conn.commit()

或者以参数化的方式来执行：

cursor.execute("update id=1 FROM persons WHERE salesrep='%s'", 'John Doe')
conn.commit()

2，执行数据的多行插入

如果要在一个事务中执行多条SQL命令，可以调用游标的executemany()函数：

cursor.executemany(operation, params_seq)

如果需要插入多条记录，可以使用游标的executemany()函数，该函数包含模板SQL 命令和一个格式化的参数列表，用于在一条事务中插入多条记录：

args=[(1, 'John Smith', 'John Doe'),
(2, 'Jane Doe', 'Joe Dog'),
(3, 'Mike T.', 'Sarah H.')]

cursor.executemany("INSERT INTO persons VALUES (%d, %s, %s)", args )
conn.commit()

六，调用存储过程
从pymssql 2.0.0开始，可以使用callproc()函数来执行存储过程，callproc()函数的语法是：

result_args = cursor.callproc(proc_name, args=())

第一个参数是存储过程的名称，第二个参数args是一个元组类型，对于存储过程的每一个参数，都需要传递值。对于OUT参数，也必须传递值，通常传递0。

callproc()函数返回的是输入args的修改之后的副本，IN参数在result_args中不变，OUT参数在result_args中代表存储过程输出的值。

举个例子，对于存储add_num，有两个IN参数，一个OUT参数：

CREATE PROCEDURE add_num(IN num1 INT, IN num2 INT, OUT sum INT)

调用callproc()函数的格式是：

result_args = (5, 6, 0) # 0 is to hold value of the OUT parameter sum
cursor.callproc('add_num', result_args)

以下示例代码，使用上下文管理器来调用callproc()执行存储过程：

with pymssql.connect(server, user, password, "tempdb") as conn:
with conn.cursor(as_dict=True) as cursor:
cursor.callproc('sp_name', ('arg1',))
for row in cursor:
print("ID=%d, Name=%s" % (row['id'], row['name']))

经过我的测试，我发现不管是使用callproc()，还是使用execute('exec sp_name')，pymssql都不能执行复杂的存储过程，这让人很是头疼。

七，pymssql模块的基本操作
1，pymssql的基本操作

from os import getenv
import pymssql

server = getenv("PYMSSQL_TEST_SERVER")
user = getenv("PYMSSQL_TEST_USERNAME")
password = getenv("PYMSSQL_TEST_PASSWORD")

conn = pymssql.connect(server, user, password, "tempdb")
cursor = conn.cursor(as_dict=False)
cursor.execute("TSQL query")
cursor.executemany("INSERT INTO persons VALUES (%d, %s, %s)",
[(1, 'John Smith', 'John Doe'),
(2, 'Jane Doe', 'Joe Dog'),
(3, 'Mike T.', 'Sarah H.')])
# you must call commit() to persist your data if you don't set autocommit to True
conn.commit()
cursor.execute('SELECT * FROM persons WHERE salesrep=%s', 'John Doe')
row = cursor.fetchone()
while row:
print("ID=%d, Name=%s" % (row[0], row[1]))
row = cursor.fetchone()
conn.close()

2，以字典集返回数据行

conn = pymssql.connect(server, user, password, "tempdb")
cursor = conn.cursor(as_dict=True)

cursor.execute('SELECT * FROM persons WHERE salesrep=%s', 'John Doe')
for row in cursor:
print("ID=%d, Name=%s" % (row['id'], row['name']))

conn.close()

3，使用with语句

with是上下文管理器，可以自动关闭上下文。如果使用with语句来创建连接对象和Cursor对象，那么就不需要显式的关闭连接和Cursor对象，在语句执行完成之后，Python会自动检测连接对象和Cursor对象的作用域，一旦连接对象或Cursor对象不再有效，Python就会关闭连接或Cursor对象。

with pymssql.connect(server, user, password, "tempdb") as conn:
with conn.cursor(as_dict=True) as cursor:
cursor.execute('SELECT * FROM persons WHERE salesrep=%s', 'John Doe')
for row in cursor:
print("ID=%d, Name=%s" % (row['id'], row['name']))

八，附上代码库
附上代码，以飨读者。

import pymssql
from sqlalchemy import create_engine
import pandas as pd
from sqlalchemy.sql import text as sql_text

class DBHelper:
def __init__(self):
self.name='DB Helper'
self.db_host = r'sql server'
self.db_name = 'db name'
self.db_user = r'sa'
self.db_password = r'pwd'

######################################################
## data connection ##
######################################################

def get_engine(self):
str_format = 'mssql+pymssql://{0}:{1}@{2}/{3}?charset=utf8'
connection_str = str_format.format(self.db_user,self.db_password,self.db_host,self.db_name)
engine = create_engine(connection_str,echo=False)
return engine

def get_pymssql_conn(self):
conn = pymssql.connect(self.db_host, self.db_user, self.db_password, self.db_name)
return conn

######################################################
## common SQL APIs ##
######################################################

def write_data(self,df,destination,if_exists='append',schema='dbo'):
engine = self.get_engine()
df.to_sql(destination, con=engine, if_exists=if_exists,index = False, schema=schema
, method='multi', chunksize=1000)

def read_data(self,sql):
engine = self.get_engine()
df = pd.read_sql(sql, con=engine)
return df

def exec_sql(self,sql):
engine = self.get_engine()
con = engine.connect()
with con.begin() as tran:
con.execute(sql_text(sql).execution_options(autocommit=True))

def exec_sp(self,sp_name,*paras):
with pymssql.connect(self.db_host, self.db_user, self.db_password, database=self.db_name) as conn:
with conn.cursor(as_dict=False) as cursor:
try:
cursor.callproc(sp_name, paras)
cursor.nextset()
conn.commit()
except Exception as e:
print(e)

def exec_sp_result(self,sp_name,*paras):
with pymssql.connect(self.db_host, self.db_user, self.db_password, database=self.db_name) as conn:
with conn.cursor(as_dict=True) as cursor:
try:
cursor.callproc(sp_name, paras)
cursor.nextset()
result=cursor.fetchall()

conn.commit()
df=pd.DataFrame.from_records(result)

return df
except Exception as e:
print(e)

」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/upluck/article/details/116969378

本站大部分文章、数据、图片均来自互联网,一切版权均归源网站或源作者所有。

如果侵犯了您的权益请来信告知我们删除。邮箱：1451803763@qq.com

标签：应用学习资料数据库爬虫

上一篇:使用selenium爬取猫眼电影榜单数据

下一篇:处理错误：Access to the path 'C:\Windows\TEMP\xxx.tmp' is denied.