![Stata统计分析与行业应用案例详解(第2版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/500/26943500/b_26943500.jpg)
1.6 定义数据的子集
1.6.1 定义数据的子集概述
在很多情况下,现有的Stata数据达不到分析要求,我们需要截取出数据的一部分进行分析,或者删除不需要进入分析范围的数据,这时我们就需要用到Stata的定义数据子集功能。在本节中,我们将通过实例的方式讲述定义数据子集的基本操作。
1.6.2 相关数据来源
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0032_0001.jpg?sign=1739555629-ItcWVGYmsExogXoDGsSG3NsRaGhOJZJV-0-9a316f1bb2e96a16170401bfda48aaf1)
【例1.5】试通过操作案例1.5.dta完成以下工作。
(1)列出第3条数据。
(2)列出第1~3条数据。
(3)列出变量值“shangjiao”最小的两条数据。
(4)列出变量值“year”大于2005的数据。
(5)列出变量值“year”大于2007且变量值“shangjiao”大于865的数据。
(6)删除第3条数据。
(7)删除变量值“year”等于2005的数据。
(8)删除变量值“year”大于2005且变量值“shangjiao”大于865的数据。
1.6.3 Stata分析过程
分析步骤如下:
进入Stata 14.0,打开相关数据文件,弹出如图1.30所示的主界面。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0032_0003.jpg?sign=1739555629-Nu75KBFkyyVH66LHAndng7pTIPLTPGRM-0-c4ec4a17ef8d788f31fc78f69a4d15d0)
图1.30 主界面
在主界面的“Command”文本框中输入操作命令并按键盘上的回车键进行确认。对应的命令如下。
●list in 3:本命令的含义是列出第3条数据。
●list in 1/3:本命令的含义是列出第1~3条数据。
●sort shangjiao list year shangjiao shenjiao in 1/2:本命令的含义是列出变量值“shangjiao”最小的两条数据。
●list if year>2005:本命令的含义是列出变量值“year”大于2005的数据。
●list if year>2007 & shangjiao>865:本命令的含义是列出变量值“year”大于2007且变量值“shangjiao”大于865的数据。
●drop in 3:本命令的含义是删除第3条数据。
●drop if year==2005:本命令的含义是删除变量值“year”等于2005的数据。
●drop if year>2005 & shangjiao>865:本命令的含义是删除变量值“year”大于2005且变量值“shangjiao”大于865的数据。
1.6.4 结果分析
图1.31是列出第3条数据的结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0001.jpg?sign=1739555629-VyOOZu9IYFnx6hmZJxB9LxDUr6S7ZUBC-0-2414ec8d1f01f87cb83c4a8d7cb83213)
图1.31 分析结果1
图1.32是列出第1~3条数据的结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0002.jpg?sign=1739555629-MgD6VCQZcSKtZD8NKPKQW13eekBTyNMc-0-4ba187bff0fcb2fde4db9b8d2af873c7)
图1.32 分析结果2
图1.33是列出变量值“shangjiao”最小的两条数据结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0003.jpg?sign=1739555629-CPe3XdxN4bF8r5UZJpNoTMmjsixZCYij-0-d577652e6f7b5b3745a283afef9e7bf7)
图1.33 分析结果3
图1.34是列出变量值“year”大于2005的数据结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0004.jpg?sign=1739555629-SwmR9GL7gSob44hZIVnsroNxeTMpnwHj-0-02810224624b6f116392f8846021185d)
图1.34 分析结果4
图1.35是列出变量值“year”大于2007且变量值“shangjiao”大于865的数据结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0005.jpg?sign=1739555629-qg9wwqLRQgA43Fq0Xjks0ZXrgNmXBfYm-0-3d1620aeeaac96b24fe03788e5fa89da)
图1.35 分析结果5
图1.36是删除第3条数据的结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0033_0006.jpg?sign=1739555629-Q5sem9RDaNvYbFohif12QTgwQbc1nM06-0-cd16f834552a5fb42764036c42c67ae0)
图1.36 分析结果6
图1.37是删除变量值“year”等于2005的数据结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0034_0001.jpg?sign=1739555629-UyfceRuRkhtDazKHMttTnw0xtbb8HdBW-0-b6197f8631bb3cb3855235ee6e9ab2ba)
图1.37 分析结果7
图1.38是删除变量值“year”大于2005且变量值“shangjiao”大于865的数据结果。
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0034_0002.jpg?sign=1739555629-gnn3Dit2YmLRYoSM14WQDSiNWuWobLTB-0-ca0fbb988c69287c19ac237f2cb487af)
图1.38 分析结果8
1.6.5 案例延伸
我们在上述的Stata命令中用到了Stata中的关系运算符和逻辑运算符。Stata 14.0中共支持6种关系运算符和3种逻辑运算符,如表1.7和表1.8所示。
表1.7 关系运算符
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0034_0003.jpg?sign=1739555629-BOIobAJf1LRTes6QKUZUfHuUVu6Ie20o-0-065fad9356d52904930c9507419e9ed7)
表1.8 逻辑运算符
![](https://epubservercos.yuewen.com/82CDCB/15367245804192406/epubprivate/OEBPS/Images/figure_0034_0004.jpg?sign=1739555629-PCme6gOgVppfNwnLqkpqDdpSNujqNoxS-0-f364f2f19bb3a4657e9fde019f62145f)