怼周刊_v24

~ 预定 17.9.25 20:20 发布

Release time - 20:20, September 25th, 2017


舍利子

抑郁难耐结丹兮 
碾转揪疼自难抗
编译不过内存溢
豆腐食多钙结石

Sarira

Depressed intolerably due to stones in the body
Tossed and turned due to can't control the pain
Compiling just cause memory overflow
Eating much tofu lead to calculus

进度 Timelines

~ 记录当周关键事件日期+证据链接

  • 170923 [42h[TASK]20170923 怼周会会 ]6
  • 170923 [4d[atl4dama]时间账单效能小队0923会议]7

任务 Tasks

~ 记述关键共怼任务 (如果没有, 留空)

进展 Progress

~ 整体上圈内部活跃指标情况

  • 提交: 10 人,
    • 小组 @zoomquiet 时间帐单:效能分析小队
      • 成员: @zsy @liguanghe @simpleowen @mxclover
    • @draachen Py104 学习
    • @hetao 深度学习
    • @liguanghe 域外生活录
    • @OMlalala 投资学习
    • @zsy 编程与写作
    • @zoejane 日常节奏形成
    • @leilayanhui Py103复习
    • @Wangjunyu 编程与工作相结合
    • @mxclover 自怼就业跃迁录
  • 引发的作品:
    • NIL

状态:

allcic Commit timesweekly Commit times
ZoomQuiet351 liguanghe29
zoejane301 mxclover9
liguanghe298 zhangshiyinrunwithcc7
mxclover183 vanxv7
zhangshiyinrunwithcc145 OMlalala5
all Commit Comments timesweekly CommitComments times
ZoomQuiet149 vanxv1
zhangshiyinrunwithcc48 liguanghe1
all Issue Comments timesweekly IssueComments times
liguanghe475 zhangshiyinrunwithcc15
ZoomQuiet410 liguanghe13
zhangshiyinrunwithcc325 ZoomQuiet8
zoejane107 mxclover4
mxclover80 vanxv1

成果 Achievements

~ 各种成品/半成品 内部知识作品

atl4dama 时间账单项目成果

@liguanghe

故事 Stories

~ 收集各自无法雷同的怼圈真人故事…

熊本🐻->0902怼周会:探索之’江湖险恶’

0902怼周会大妈现场剖析了怼圈血案1例,‘小鹤装pyenv’,并提出 探索需明确需求,探索每次只能一小步,只因心智经不起长久战.
此文深入血案现场,阐述血案发生经过,并采访当事者血案结果. 以事实问道理,以血案提醒怼友探索的’江湖险恶’.

  • 血案现场

  • 背景

    • 小鹤macox同时安装了python2和python3,且安装了以py2为基础的jupyter notebook.
    • 为完成atl4dama数据分析,需要安装以py3为基础的pandas.
  • 目标

    • 保证pandas在py3环境中顺利运行.
  • 行动

    • 发布issue,与大妈,浚宇讨论方案.
    • 最终尝试安装pyenv,并形成pyenv安装测试教程.
  • 时间成本

    • 5个半小时.

2.案发回顾:第二方案

  • 目标
    • 保证pandas在py3环境中顺利运行.
  • 方案
    • 如小鹤并没有使用python2强烈需求可考虑
      • 删除python2,只保留python3
      • pip安装jupyter notebook
      • pip安装pandas
  • 值得思考的
    • 以现在的需求看,需要同时安装py2和py3吗?
    • 一定要用pyenv吗?
    • pyenv是新工具,调试pyenv有成本,一定要立刻就付出成本吗?
    • 一定要同时安装jupyter notebook和pandas吗?

3.探索之’江湖险恶’

探索之’恶’,恶分两处:一处是生产率下降,另一处是心智损耗.
生产率下降在于,探索需要在 不成熟的领域 投入时间 成本,且难以有稳定回报.
心智损耗在于,探索者往往期待高收益,却一再遭遇低收益现实,落差积累,心智耗光,行为瘫痪.

探索不是综艺节目里的模拟游戏,而是真刀真枪会有伤害的角斗场. 如何降低伤害?如何提高防御值?
可借鉴大妈习惯 刻意停顿. 停下来,问一问:

  • 为什么要走一步?
  • 是不是一定要走这一步?
  • 有没有更简单(更容易固定/批量化)的方法?

特作诗一首,献给路途中的探索者们,愿他们时常自检,多加小心.

提醒诗

好朋友往哪走
心智虽有不长久
多问需求为何有
自筹因果入二酉(二酉:古代指丰富的藏书)

@liguanghe 数据 bug, 脚本改进

项目遇到bug怎么办?

bug

  • (时间账单项目)做折线图时发现异常. set4 应该在0-2 之间, 在10-20区间的都是异常, 尝试找出这两个数据(另开 .ipynb 文档检测数据异常) 看atl2SET4dama_all.csv 2015,01,17.927306943389056 2014,01,21.787416651210933

思路

  • 将最迟的数据(单周数据)放在最迟的算法里, 发现是什么问题.
  • 回推
    • 原始数据 - 数据清洗 - 数据统计
    • 13-2.report -> atl2dama4all.csv -> df_isocalendar.csv -> weekly(2014-w01.csv) -> atl2SET4dama_all.csv
  • 不用看回尝试 .ipynb, 而是应该直接 copy .py 脚本, 在自己的.ipynb 格式里拆解,逐一计算中间数据,排查是数据还是算法的问题.
  • 理解每个过程数据的意义.

解决

  • 因数据有错, 所以改进算法.
  • 有结束时间小于开始时间的记录错误
  • 要筛除这类数据, 不去使用.
  • 添加一行代码: x=df4LOTa_drop_top1sleep[df4LOTa_drop_top1sleep.du_time > 0] TBT = x.du_time.sum()

changelog

  • 将2014w01 周数据放入 zq7 逐个过程数字算出: lgh2DebugSET4data0919.ipynb

  • 2014w01 set4 数据异常排查: TBT = -31241700.0, 异常, TBC = 68(属于正常范围), 导致 TBI = -15.952665441176471
    对比 2014w02 TBT=225060 TBC=77 TBI=0.1

  • 2015w1 TBT = -31330680.0 TBC = 56 TBI = -19.426264880952377

  • TBT 是基于什么, 为什么在2014年会异常

  • 是 TBT 这个变量本身的设置问题, 还是2014年的数据在这个变量里不适合? (edited)

TBT?

大妈在zq2analyze.ipynb 中说, 这是中断时长

+ 以及每天的: `中断指数` (**TBI** ~ Totle Broken Index) 为加权
    * TBT ~ 中断总时长
    * TBC ~ 中断次数
    * 设每天有效工作时间为8小时
    * (TBT/TBC)/(8*60*60) -> 平均中断时长 占有效工作时间比例 -> TBI 
    * 即,每天平均中断时长占有效工作时间的比例, 记为: `xx.xTBI`

结合代码

df4LOTa_drop_top1sleep = df4LOTa.drop(_top1sleeps, axis=0)

这是去掉 睡眠 数据的表格

TBT = df4LOTa_drop_top1sleep.du_time.sum()

意思应该是: 除了第一睡眠数据和输出时间之外的其他时长的总和

TBC 应该是 除了第一睡眠数据和输出时间之外的其他数据的次数 TBI 应该是 其他时间/其他次数/8小时(工作时长)

TBT 不应该是负数, 说明有一条不在20%的数据是记录错误 排查方法见上文, dutime<0

添加解决: dutime>0

这里要注意的是:遇到源数据有问题, 也不应该删掉源数据, 而是用代码来从根本上排除错误的源数据.

  • 项目下一阶段的人, 也可能随时需要发现上一阶段结果出了问题, 此时再学习对应脚本, 用 .ipynb 拆解代码逐个了解, 是很好的办法.
  • 尽可能的多了解之前的代码
  • 数据的问题不难, 运用以前上学时的简单数学和过往办公软件的经验, 再加上 pandas的简单操作, 可以解决很多问题.

推荐 Recommedations

~ 嗯哼各种怼路上发现的嗯哼…

后记 Postscript

~ 怼周刊是什么以及为什么和能怎么…

大妈曰过: 参差多态 才是生机 问题在 参差 的行为是无法形成团队的

Coming together is a beginning; 
Keeping together is progress; 
Working together is success!

<— Henry Ford

  • 所以, 有了 大妈 随见随怼的持续嗯哼…
  • 但是, 想象一年后, 回想几十周前自己作的那些 图样图森破
  • 却没现成的资料来出示给后进来嗯哼?
  • 不科学, 值得记录的, 就应当有个形式固定下来
  • 所以,有了这个 怼周刊 (Weekly 4 DU)

What is DUW? Why we make DUW? What are the possibilities of DUW?

Dama said, variety brings vitality. But various behaviors may make us hard to cooperate as a team.

Coming together is a beginning; 
Keeping together is progress; 
Working together is success!

<— Henry Ford

That’s why Dama keeps on debugging. However, as time goes by, maybe you would not remember these days clearly and spread your experience difficultly. What a pity! The valuable should have a fixed form to be recorded. That’s why we make the Weekly for DU.