现如今,大数据的发展越来越好,也越来越多的企业中大数据分析已经朝着更好的方向发展。也正是因为这个原因,数据分析行业的人才需求也变得火爆起来,尤其是数据分析、数据挖掘、数据科学家等高端人才,越来越稀缺。
当然,对于数据分析这个工作,的确是需要学会一些编程语言的,比如MATLAB,Python,Java等语言。但是对于初学者来说,Python是一个不错的语言,Python语言简单易懂还具有强大的编程能力,同时对于大数据分析有很明显的帮助。
今天的主要关键内容是我们Python中最基础的两个部分,变量名命名规则和字符串方法。在处理数据的过程中,我们需要创建一些变量名进行赋值,那变量名命名时有什么规则呢?
变量名命名规则
- 变量名由数字、字母、下划线组成。**但不能以数字开头**
- 命名时应当避开关键字。
```python
#查看python关键字
import keyword
kw = keyword.kwlist
print(kw)
```
```python
#运行结果
['False', 'None', 'True', 'and', 'as', 'assert', 'async', 'await', 'break', 'class', 'continue', 'def', 'del', 'elif', 'else', 'except', 'finally', 'for', 'from', 'global', 'if', 'import', 'in', 'is', 'lambda', 'nonlocal', 'not', 'or', 'pass', 'raise', 'return', 'try', 'while', 'with', 'yield']
```
在Python中方法相当于函数功能,Python为我们提供了许多方法便于我们处理数据,接下来我们接触几个简单的字符串方法。体验一下他们神奇。
字符串方法
- center 通过在两边添加填充字符(默认为空格)让字符串居中
```python
b = "我想居中"
print(b.center(80))
print(b.center(80,"-"))
```
> ? 我想居中
>
> --------------------------------------我想居中--------------------------------------
- find 在字符串中查找子串。如果找到,就返回子串的第一个字符的索引,否则返回-1
- index 在字符串中查找子串。如果找到,就返回子串的第一个字符的索引,否则引发ValueErorr异常
```python
h = 'my name is Lexi'
print(h.find('m'))
print(h.index('n'))
#两个函数都可限制搜索范围
print(h.find('n',0,2)) #同时制定起点和终点
print(h.index('n',2)) #只制定了起点
```
- join 用于合并序列的元素
```python
#合并一个字符串列表
sep = ["1","3","4","5"]
seq = '+'
seq.join(sep)
#用 join 地址拼接场景
dirs = '','usr','bin','env'
print('C:'+''.join(dirs))
```
- lower 返回字符串的小写版本
```python
'Hello World'.lower()
'classical my girl'.title() #首词大写
#在string模块中有个capwords可以实现首词大写
import string
string.capwords("that's your book")
```
- replace 将指定的子串都替换为另一个字符串,并返回替换后结果
```python
'this is your book'.replace('is','eez')
```
- split 返回一个列表,按照分割符进行划分
```python
'1+2+3+4+5'.split('+')
```
- strip 删除指定字符
- rstrip 从右边删除指定字符
- lstrip 从左边删除指定字符
```python
#去除输入的空格
k = input("请输入一个数字")
print(k.strip())
#去除指定的字符(只能去除开头或者结尾的字符,中间的还是会被保留)
clear = '###$%%^^%$#^!#!$!'
print(clear.strip("#"))
```