
在实操大数据之前,我们可以先在本地进行一些小型数据库的操作,对sql和spark进行一些初步了解。本文就先介绍下mysql和workbenck的安装和使用,以及
腾讯云 2023-03-02 07:11:11
在实操大数据之前,我们可以先在本地进行一些小型数据库的操作,对sql和spark进行一些初步了解。本文就先介绍下mysql和workbenck的安装和使用,以及介绍python链接数据库的操作。后续文章再介绍详细的使用python对库表的sql操作,以及spark计算。
按照指示操作默认安装,在安装时,MySQL会要求我们设置一个本地登陆账号,账号名一般命为root,端口为3306,自定义一个password即可。
(相关资料图)
官方下载MySQL Installer:
下载后按照步骤安装,安装完成后启动
输入密码就可以进入啦~
官方下载链接:https://dev.mysql.com/downloads/workbench/
按照步骤进行安装,安装完成后启动
输入设置的mysql的密码进入,然后创建一个schema
创建后,在左侧Schemas的tab就能看见创建的数据库了,然后就可以在里面创建自己的tables。
由于 MySQL 服务器以独立的进程运行,并通过网络对外服务,所以,需要支持 Python 的 MySQL 驱动来连接到 MySQL 服务器。
目前,有两个 MySQL 驱动:
1. mysql-connector-python:是 MySQL 官方的纯 Python 驱动
2. MySQL-python :是封装了 MySQL C驱动的 Python 驱动
我们用python链接,所以需要pip库
install mysql-connector-python
mysql安装我们已经有了用户名和密码, 因为链接的本地数据库,所以ip:port默认是localhost:3306,在workbenck里面我们已经创建了一个数据库test。
使用代码创建数据库链接:
config = { "user" : "root", #用户名 "password" : "123456", #自己设定的密码 "host" : "127.0.0.1", #ip地址,本地填127.0.0.1,也可以填localhost "port" : "3306", #端口,本地的一般为3306 "database" : "test", #数据库名字,这里选用test}con = mysql.connector.connect(**config)# buffered = True 不设的话,查询结果没有读完会报错# raise errors.InternalError("Unread result found")mycursor = con.cursor(buffered = True)
通过执行sql语句,创建库表以及往表内插入数据:
def create_table_test(table_name): # 创建一个表 sql = "CREATE TABLE %s (id INT AUTO_INCREMENT PRIMARY KEY, \ name VARCHAR(255) , address VARCHAR(255), \ sex VARCHAR(225) , age INT(10) , sl INT(10))"%(table_name) mycursor.execute(sql) def insert_table_test(table_name): # 往表里插入一些记录 sql = "INSERT INTO " + table_name + "(name,address,sex,age,sl) VALUES(%s,%s,%s,%s,%s)" # print("sql", sql) val = ("zhangsan", "beijing", "M", 23, 30000) mycursor.execute(sql, val) val = ("lisi", "shanghai", "F", 23, 30000) mycursor.execute(sql, val) val = [("zhangsan", "shenzhen", "M", 35, 30000), ("zhangsan", "beijing", "M", 28, 30000), ("zhangsan", "aomen", "F", 30, 40000), ("zhangsan", "hongkang", "M", 35, 30000), ("zhangsan", "taiwan", "M", 32, 20000)] mycursor.executemany(sql, val) con.commit()
如果有大量数据,通过以上插入就比较麻烦, 我们也可以通过导入本地,这里就需要使用ORM技术。
ORM技术:Object-Relational Mapping,把关系数据库的表结构映射到对象上。在Python中,最有名的ORM框架是SQLAlchemy。
我们先安装SQLAlchemy:
pip install sqlalchemypip install pandas
为了方便,我们先在workbenck里创建sql_test表,
右键-->create table。
然后执行如下代码:
import pandas as pdfrom sqlalchemy import create_engineimport pymysqlexcelFile = r"F:\spark_code\my_sql_test.xlsx"def create_table_from_excel(): df = pd.DataFrame(pd.read_excel(excelFile)) engine =create_engine("mysql+pymysql://root:123456@localhost:3306/test") df.to_sql("sql_test",con=engine,if_exists="replace",index=False)
参考:
https://www.cnblogs.com/PacificOcean/p/14558449.html
https://cloud.tencent.com/developer/article/1443032
在实操大数据之前,我们可以先在本地进行一些小型数据库的操作,对sql和spark进行一些初步了解。本文就先介绍下mysql和workbenck的安装和使用,以及
1、选中左下角的深渊魔王,然后按键盘上的↓就行了 隐藏英雄是个远程的,有永久献祭、耐久光环、致命一击、大招忘了这个英雄后
1、2021粤港澳大湾区科技时尚文化周由广东省服饰文化促进会、广东省粤港澳合作促进会时尚品牌委员会主办,清华大学文化
1、电脑截长图的方法:如果是超长的图片,需要保存到本地,可以使用另存为的方法。2、具体方法:在超长的图片上面,右击,点击
开局即决战,起步即冲刺。为决战首季“开门红”,江苏国资国企纷纷拿出实招硬招,细致谋划,提早布局。从项目工地到车间一线,处处呈现热火朝
1、【如梦方醒】大象刚从梦中醒来。2、比喻过去有过困惑,受到别人或事实的启发,刚刚明白。3、【如果太阳升起】如:大象;方
1、市场营销这个概念是相对于传统的市场推销而言的,市场营销是客户找你,市场推销是你找客户;对于市场推销者,一个产品卖出去
一、关于投递员的读法1、读法:[tóudìyuán]二、关于投递员的释义2、基础释义:负责投递邮件和电报的人员。
中级会计没有年龄限制,只需符合官方规定的报考条件即可报名。中级会计职称考试在9月9日-11日,分三天举行,共三个批次,每个批次的上午考《中
1、客厅装修时一般都会使用石膏板吊顶,石膏板吊顶造型很多。2、在设计石膏板吊顶时都会以客厅的空间结构和装修风格来考虑如何
1、大股东减持对股票产生两个不利的影响一是稀释了二级市场的资金总量,因为大股东们减持1%,往往也会带来数千万元甚
怎样推动具有北京特色的基础研究发展创新?如何坚持目标导向和自由探索相结合,推动本市基础研究高质量发展?怎样加强对基础研究人才的支持力
1 6看以上陈数的这套LOOK,显得多么野性啊,看到陈数外穿一件豹纹风的长袖,下搭卡其色的半身裙一条,使得陈数看起来的话很有都市丽人风。另外
1、1、到附近的营业厅办理安装:2、在营业厅办理的时候,需要携带本人的身份证去申请安装和缴费,可以咨询业务员关于套餐的种
欢迎观看本篇文章,小升来为大家解答以上问题。什么是垃圾食品,垃圾食品应该少吃很多人还不知道,现在让我们一起来看看吧!1、