本書勘誤表Errata

第4章

67頁
4-4設定Hadoop 環境變數
Step1. 編輯~/.bashrc

>設定HADOOP其他環境變數
原來的內容(紅字的部分重複了)
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME
勘誤修改內容
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export YARN_HOME=$HADOOP_HOME


第6章

131頁
6-5 複製與刪除HDFS 檔案
Step1. 複製HDFS 檔案

>複製HDFS檔案至HDFS測試目錄
原來的內容(紅字為錯誤)
hadoop fs -cp /user/hduser/test/README.txt /user/hadoop/test/temp
勘誤修改內容(藍色為校正)
hadoop fs -cp /user/hduser/test/README.txt /user/hduser/test/temp
132頁
>查看HDFS測試目錄

原來的內容(紅字為錯誤)
hadoop fs -ls /user/hadoop/test/temp
勘誤修改內容(藍色為校正)
hadoop fs -ls /user/hduser/test/temp
第8章

168頁
8-8 在Hadoop YARN 執行 spark-shell
Step2.讀取本機檔案

>讀取本機檔案
原來的圖片(錯誤)

勘誤修改圖片(正確)

第9章

188頁
Step5.map 字串運算


原來的內容(少了.collect)
stringRDD.map(x=>"fruit:"+x)
勘誤修改內容(藍色為校正)
stringRDD.map(x=>"fruit:"+x).collect


193頁
 


intRDD1是List(3, 1, 2, 5, 5),與intRDD2的List(3, 1, 2, 5, 5)之間重複元素只有5,所以回傳Array(5)
(藍色為校正)
intRDD1是List(3, 1, 2, 5, 5),與intRDD2的List(5, 6)之間重複元素只有5,所以回傳Array(5)

194頁
 

>依照由小到大排序取出前N筆資料,例如取出前3 筆

原來的內容(少了O字母)
intRDD.takerdered(3)
勘誤修改內容(藍色為校正)
intRDD.takeOrdered(3)


207頁
 

>使用對照表轉換資料

原來的內容(紅字為錯誤)
KV(4) KV 對照表傳入參數4,轉換為2
勘誤修改內容(藍色為校正)
KV(1) KV 對照表傳入參數1,轉換為2


第11章

294頁
Step3.map 字串運算


原來的內容(紅字為錯誤)
model.recommendProducts(464,5).mkString("\n")
勘誤修改內容(藍色為校正)
model.recommendUsers(464,5).mkString("\n")


第11章

307頁

原來的內容(紅字為錯誤)
 RecommendMovie.foreach { r =>      
         println(i.toString() + "." + movieTitle(r.product) +
            "評價:" + r.rating.toString())    
         var i = 1
          i += 1 
   }

勘誤修改內容(藍色為校正)
 var i = 1
 RecommendMovie.foreach { r =>      
         println(i.toString() + "." + movieTitle(r.product) +
            "評價:" + r.rating.toString())    
          i += 1 
   }




第14章

396頁


原來的內容(紅字為錯誤)
14-3 執行RunDecisionTreeRegression.scala 進行參數調校
勘誤修改內容(藍色為校正)
14-3 執行RunLogisticRegressionWithSGDBinary.scala 進行參數調校

400頁
原來的內容(紅字為錯誤)
14-4 執行RunDecisionTreeRegression.scala 不進行參數調校
勘誤修改內容(藍色為校正)
14-4 執行RunLogisticRegressionWithSGDBinary.scala 不進行參數調校






此圖出自Spark官網 https://spark.apache.org/
Share on Google Plus

About kevin

This is a short description in the author block about the author. You edit it by entering text in the "Biographical Info" field in the user admin panel.
    Blogger Comment
    Facebook Comment

4 意見:

  1. 請問老師會公布之後章節的指令嗎?
    我現在在操作11章節的語法

    回覆刪除
  2. page 417:

    Step 1. 匯入 SVMWithSGD 程式庫
    >> Step 1. 匯入 NaiveBayes 程式庫

    回覆刪除
  3. page 428:

    Step 1. 重複兩次

    回覆刪除
  4. 365頁 TN跟FN的解釋也錯了吧

    回覆刪除