第十三號艦隊

Build & Install Boost Library

Posted on 2014-03-11 Edited on 2025-06-15 In c++

寫一下編譯跟安裝Boost該注意的事，目前先寫Linux下的情況，有時間日後再補上

Linux (Ubuntu 13.04)

1
2
3

$ apt-get install g++ g++-4.8 g++-4.8-multilib gcc-4.8-doc libstdc++6-4.8-dbg libstdc++-4.8-doc
$ cd boost_1_55_0
$ ./bootstrap.sh ## Generate bjam

關於bootstrap.sh的詳細用法可以打./boostrap.sh --help獲得，。如果不更改--prefix的話，預設的路徑就是/usr/local。

1	$ ./bjam --build-dir=./tmp --stagedir=./build

關於bjam的常用使用說明可以參照，以下是常用參數

–build-dir=directory 將build過程的中間產物放置目錄底下，方便管理
–stagedir=directory 最後編譯完成的Library放置處
–variant=debug | release 可以選擇Release 或是 Debug模式
–link=static | shared 選擇build出來的事static library或是sshared library
–threading=single | multi 選擇Threading model
–runtime-link=static | shared 連結C/C++ Standard Library時，選擇Static library或是Shared library link
–with-
只編譯某Library，如 --with-regex
` –clean 清理中間產物
編譯玩之後就可以安裝了
1
$ ./bjam install

Two Bittorrent library

Posted on 2014-03-06 Edited on 2025-06-15 In Network , library

在網路上搜尋找到的，兩個名字很像，不過作者不同

libtorrent (asterbar Software)
libTorrent (rakshasa)
有時間就得花時間看看。

More information on range-based for-loop

Posted on 2014-03-05 Edited on 2025-06-15 In c++ , C++11

在Stackoverflow看到，怕忘記寫下來。

如何對std::map使用 for-ranged syntax

原文在此。
簡單的說就是用auto去接reference。

1
2
3

for (auto& kv : myMap) { 
	std::cout << kv.first << " has value " << kv.second << std::endl; 
}

如何反向訪問container

原文在此。
最簡單的方法是使用Boost

#include <boost/range/adaptor/reversed.hpp>

for (auto i : boost::adaptors::reverse(x))
        std::cout << i << '\n';

如果沒有boost的話也可以土法煉鋼，原文Paul的方法不能使用，選用下面Jive的方案

template<class Fwd>
struct Reverser_generic {
	Fwd &fwd;
	Reverser_generic(Fwd& fwd_) : fwd(fwd_) {}
	typedef std::reverse_iterator<typename Fwd::iterator> reverse_iterator;
	reverse_iterator begin() { return reverse_iterator(std::end(fwd)); }
	reverse_iterator end() { return reverse_iterator(std::begin(fwd)); }
};

template<class Fwd >
struct Reverser_special{
	Fwd &fwd;
	Reverser_special(Fwd& fwd_) : fwd(fwd_) {}
	auto begin() -> decltype(fwd.rbegin()){ return fwd.rbegin(); }
	auto end() ->decltype(fwd.rbegin())   { return fwd.rend(); }
};

template<class Fwd>
auto reverse_impl(Fwd& fwd, long) -> decltype(Reverser_generic<Fwd>(fwd)){
	return Reverser_generic<Fwd>(fwd);
}

template<class Fwd>
auto reverse_impl(Fwd& fwd, int)
-> decltype(fwd.rbegin(), Reverser_special<Fwd>(fwd))
{
	return Reverser_special<Fwd>(fwd);
}

template<class Fwd>
auto reverse(Fwd&& fwd) -> decltype(reverse_impl(fwd, int(0))) {
	static_assert(!(is_rvalue_reference<Fwd&&>::value),
		"Cannot pass rvalue_reference to dj::reverse()");
	return reverse_impl(fwd, int(0));
}

Magazines for programmer

Posted on 2014-03-05 Edited on 2025-06-15

最近這種雜誌越來越多了，列出來備忘。

ack / ag - enhance grep for programmer

Posted on 2014-03-03 Edited on 2025-06-15 In Tools , Tips

相信大家都有用過grep來找文字，不過這個ack是專為程式設計師開發的。
從官網下載並安裝

1
2
3

$ curl http://beyondgrep.com/ack-2.12-single-file > ack
$ sudo mv ack /usr/local/bin
$ sudo chmod 755 /usr/local/bin/ack

ack有以下這些特性

預設就搜尋當前目錄
預設搜尋所有子目錄
忽略Metadata資料節，如.svn和.git等
忽略Binary檔
印出找到Pattern的行號
能夠搜尋特定文件類型的檔案 (如Perl/C++)
Highlight搜尋結果
支持Perl的Advance Regular Expression

幾個常用的功能

如何只搜尋`eat`而忽略掉`feature`和`eating

1	$ ack -w eat

當Pattern中有特殊字元的時候，需要當作Literal chracter被匹配

1	$ ack -Q '$path/$'

放棄搜尋某些目錄

1	$ ack about --ignore-dir=downloads

列出某些特定文件類型的檔案，列出擁有Pattern的檔案名稱

以Makefile為例，可能的檔名有 *.mk, makefile, Makefile
我們想知道這些檔案裡面哪些定義了CFLAGS，就能夠這樣作

1	$ ack --make -l CFLAG

Highlight某些特定Pattern

1	$ tail -f /var/log/syslog \| ack --passthru 192.168.1.10

這裡的passthru是不管有沒有匹配到都會輸出。

Update

在網路上釉看到ag這套軟體。用途大同小異。多了一些ack沒有的功能。
可以參考Conquering the Command Line Chapter 2. Ack/Ag

git workflow

Posted on 2014-02-27 Edited on 2025-06-15 In git

既然git是個自由度很高的version control system，對於該怎麼工作這件事，也沒有什麼固定答案，除了當SVN那樣子用法之外，還有其他答案，因此就有這篇文章的產生。

Simple Git Workflow

重點只有三個

當要開發New features時，就開一個New feature的Branch，且在上面開發
將New feature的Code合併回master
另外準備一個Branch，用作Deploy/Release用，在這邊發布的Code要經過Well test過的

A successful Git branching model

這是上面那種方式的無敵加強版

Mainstream從master移到了develop，master只維持穩定的版本。
feature分支一樣是開發New feature，完成之後會合併至develop
Release branches: 準備要 release 的版本，只修 bugs。從 develop 分支出來，完成後 merge 回 master 和 develop
Hotfix branches: 等不及 release 版本就必須馬上修 master 趕上線的情況。會從 master 分支出來，完成後 merge 回 master 和 develop
這套流程固然強大，不過太複雜了。
用git-flow可以幫助簡化一些情況。
可以參考Git flow 開發流程

Github flow

有鑑於上面那種方式太複雜，又衍生出來的新方式，也是GitHub自己在用的工作流程。感覺很像第一種方式，不過加上了Code review的能力。

master branch必須是deployable
每個功能fork出branch，push到remote repository
發送pull request
master developer會Review code且merge to master
這篇 Why Github Flow Better? 簡單介紹了git flow跟github flow的優缺點。
[Git Tutorials] (https://www.atlassian.com/git/workflows)簡介了大部分的Git flow。

Tools for multi-thread programming for linux

Posted on 2014-02-16 Edited on 2025-06-15 In Clang , GCC , Linux

Helgrind 和 DRD

這兩個工具都是Valgrind的一部分，用途也相同，檢查Thread error，不過用的策略不同，可以交替使用檢茶室否有無隱藏的錯誤。
以下是從Binary hacks抄下的範例

#include <pthread.h>
static int count = 1;
void *incr_count(void *p) {
        count++;
        return 0;
}
static pthread_mutex_t m1 = PTHREAD_MUTEX_INITIALIZER;
static pthread_mutex_t m2 = PTHREAD_MUTEX_INITIALIZER;
void *lock_m1_then_m2(void *p) {
        pthread_mutex_lock(&m1);
        pthread_mutex_lock(&m2);
        pthread_mutex_unlock(&m2);
        pthread_mutex_unlock(&m1);
        return 0;
}
void *lock_m2_then_m1(void *p) {
        pthread_mutex_lock(&m2);
        pthread_mutex_lock(&m1);
        pthread_mutex_unlock(&m1);
        pthread_mutex_unlock(&m2);
        return 0;
}
int main() {
        pthread_t t1, t2, t3, t4;
        pthread_create(&t1, NULL, incr_count, NULL);
        pthread_create(&t2, NULL, incr_count, NULL);
        pthread_create(&t3, NULL, lock_m1_then_m2, NULL);
        pthread_create(&t4, NULL, lock_m2_then_m1, NULL);
        pthread_join(t4, NULL);
        pthread_join(t3, NULL);
        pthread_join(t2, NULL);
        pthread_join(t1, NULL);
        return count;
}

裡面有兩個錯誤，一個是count在multi-thread的情況沒有保護，這種情況也可以用下面的thread-sanitizer偵測出來。
另外一種情況就是lock的順序不同，導致Deadlock的情景。
編譯且執行

1 2	$ gcc demo.c -o demo -lpthread $ valgrind --tool=drd ./demo

輸出太長，列出感興趣的部份

==5172== Possible data race during write of size 4 at 0x600C90 by thread #3
==5172== Locks held: none
==5172== at 0x40065F: incr_count (in /home/hungming/a)
==5172== by 0x4C2DB38: ??? (in /usr/lib/valgrind/vgpreload_helgrind-amd64-linux.so)
==5172== by 0x4E3BE99: start_thread (pthread_create.c:308)
==5172==
==5172== This conflicts with a previous write of size 4 by thread #2
==5172== Locks held: none
==5172== at 0x40065F: incr_count (in /home/hungming/a)
==5172== by 0x4C2DB38: ??? (in /usr/lib/valgrind/vgpreload_helgrind-amd64-linux.so)
==5172== by 0x4E3BE99: start_thread (pthread_create.c:308)

上面這編列出可能有data-race的情形。

==5172== Thread #5: lock order “0x600CA0 before 0x600CC8” violated
==5172==
==5172== Observed (incorrect) order is: acquisition of lock at 0x600CC8
==5172== at 0x4C2DFCD: pthread_mutex_lock (in /usr/lib/valgrind/vgpreload_helgrind-amd64-linux.so)
==5172== by 0x4006FB: lock_m2_then_m1 (in /home/hungming/a)
==5172== by 0x4C2DB38: ??? (in /usr/lib/valgrind/vgpreload_helgrind-amd64-linux.so)
==5172== by 0x4E3BE99: start_thread (pthread_create.c:308)
==5172==
==5172== followed by a later acquisition of lock at 0x600CA0
==5172== at 0x4C2DFCD: pthread_mutex_lock (in /usr/lib/valgrind/vgpreload_helgrind-amd64-linux.so)
==5172== by 0x40070B: lock_m2_then_m1 (in /home/hungming/a)
==5172== by 0x4C2DB38: ??? (in /usr/lib/valgrind/vgpreload_helgrind-amd64-linux.so)
==5172== by 0x4E3BE99: start_thread (pthread_create.c:308)

這邊告訴我們lock的順序不對。
更多的使用方法可以參考
Helgrind使用說明
 DRD使用說明

thread-sanitizer

thread-sanitizer現在已經是LLVM的一部分，在編譯LLVM的時候就會編譯完成，而GCC 4.8之後也支援thread-sanitizer。
這跟上面的不同是檢查data-race issue。
寫個sample code

#include <pthread.h>
int Global;
void* Thread1(void* x) {
        Global++;
        return NULL;
}

void* Thread2(void* x) {
        Global--;
        return NULL;
}

int main() {
        pthread_t t[2];
        pthread_create(&t[0], NULL, Thread1, NULL);
        pthread_create(&t[1], NULL, Thread2, NULL);
        pthread_join(t[0], NULL);
        pthread_join(t[1], NULL);
        return 0;
}

這個範例很簡單，可以看出 Global 在不同Thread下操作可能出現問題。
編譯且執行，注意要加上-fsanitize=thread

1 2	$ clang simple_race.c -fsanitize=thread -g $ ./a.out

同樣列出我們所關心的部份

WARNING: ThreadSanitizer: data race (pid=4441)
Location is global ‘Global’ of size 4 at 0x7f4d31e90ad8 (a+0x0000016caad8)
SUMMARY: ThreadSanitizer: data race ??:0 Thread2

有了Tool之後，從Log分西問題出在哪就便得很重要了。

git subtree

Posted on 2014-02-12 Edited on 2025-06-15 In git

在網路上搜尋了一下，發現這功能真是好用。
原先的git submodule缺點不少，一堆批評的聲音。因此之後就有git subtree的誕生，，官方也建議用git subtree解決大部分的問題。

主要應用在兩個場景

引用另外一個Repository的管理

假設在我們的Repository當中，需要引用另一個Repository(如Application需要3rd party library)的內容時，盡其希望其Repository能夠跟著更新，一旦我們對其修改時，也能擁有修改和提交的權利。

第一步：建立目前Repository跟Sub Repository的關聯性

1 2	$ git remote -f add <name of sub_repo> <address of sub_repo> $ git subtree add --prefix=<name of sub_directory> <name of sub_repo> <branch> --squash

第一個指令加上-f是建立關聯之後再度進行fetch作業。
而第二個指令加上--squash是要把Sub Repository的history合併成一個。
例如

1 2	$ git remote add -f ai https://github.com/aoxu/ai.git $ git subtree add --prefix=ai ai master --squash

第二步：更新Sub Directory

一旦Sub Repository有人更改之後，我們希望把修改的東西合併到我們 Repository中。

1 2	$ git fetch <name of sub_repo> <branch> $ git subtree pull --prefix=<name of sub_directory> <name of sub_repo> <branch> --squash

這就類似上面的情況了，一樣給的範例

1 2	$ git fetch ai master $ git subtree pull --prefix=ai ai --squash

第三步：將修改推送到Remote Repository

Push只需要一個步驟

1	$ git subtree push --prefix=<name of sub_directory> <name of sub_repo> <branch>

同樣有個範例

1	$ git subtree push --prefix=ai ai master

如果不用git subtree的話，也有個Subtree merge strategy見仁見智了。

參考資料：

將Sub directory拆成令外一個Repository

這剛好跟上面那個使用奇境相反，使用方式如下

第一步：先將sub directory的資料建立new branch

1	$ git subtree split -P <sub_directory> -b <branch>

第二步：準備new repository並且啦取原先repository的branch資訊

1
2
3

$ mkdir <new-repo> && cd <new-repo>
$ git init
$git pull <path of original repo> <name-of-new-branch>

第三步：建立Remote Repository的關聯並推送到遠方

1 2	$ git remote add origin <git@github.com:my-user/new-repo.git> $ git push origin -u master

參考資料：

Use case for smart pointer

Posted on 2014-02-10 Edited on 2025-06-15 In C++11

看了書之後豁然開朗啊，之前還真是個半調子。總結一下使用情境。

從失敗的例子講起

struct Obj {
  string name_;
	Obj(const string& name) :name(name_) {}
	~Obj() {}
};
class ObjFactory {
	map<string, shared_ptr<Obj>> lookup_;
public:
	shared_ptr<Obj> get(const string &name)
	{
		auto it = lookup_.find(name);
		if (it != lookup_.end())
			return it->second;
		lookup_[name] = shared_ptr<Obj>(new Obj(name));
		return lookup_[name];
	}
};

這段程式碼最大的問題就是，如果ObjFactory的instance沒被摧毀，所有拿到的Obj都不會被釋放。

用 weak_ptr 取代 shared_ptr

在ObjectFactory的部份不要保存shared_ptr，這樣會增加reference count，用weak_ptr取而代之。需要的話再promotion成shared_ptr。

class ObjFactory {
	map<string, weak_ptr<Obj>> lookup_;
public:
	shared_ptr<Obj> get(const string &name)
	{
		auto it = lookup_.find(name);
		if (it != lookup_.end())
		{
			shared_ptr<Obj> obj((it->second).lock());
			return obj;
		}
		shared_ptr<Obj> instance(new Obj(name));
		weak_ptr<Obj> obj(instance);
		lookup_[name] = obj;
		return instance;
	}
};

看起來沒什麼問題，不過譽到以下這種情況就爛了

for (int i = 0; i < 3; i++)
{
	shared_ptr<Obj> s = pFactory->get("HM");
	if (s) {
		cout << "create new obj" << endl;
	}
	else {
		cout << "cannot create new obj" << endl;
	}
}

我們希望看到的是每次都能拿到一個新物件，結果發現只有第一次能成功。原因出在當Obj被摧毀的時候，沒有順便清理掉ObjFactory 當中的lookup_的資料，以致於下一次使用的時候，可以找到上一次殘留的屍體，promtion之後就是一個空的shared_ptr。
解決方法就是使用shared_ptr時，同時自訂一個destructor，除了釋放memory之外，也把map裡面的資料輕空。

class ObjFactory {
	map<string, weak_ptr<Obj>> lookup_;
	void deleteObj(Obj *pObj)
	{
		lookup_.erase(pObj->name_);
		delete pObj;
	}
public:
	shared_ptr<Obj> get(const string &name)
	{
		auto it = lookup_.find(name);
		if (it != lookup_.end())
		{
			shared_ptr<Obj> obj((it->second).lock());
			return obj;
		}
		shared_ptr<Obj> instance(new Obj(name), bind(&ObjFactory::deleteObj, this, placeholders::_1));
		weak_ptr<Obj> obj(instance);
		lookup_[name] = obj;
		return instance;
	}
};

現在看起來正常了，不過街下來這個Case又會遇到問題。

{
	shared_ptr<Obj> obj1 = pFactory->get("Obj1");
	delete pFactory;
}

由於在這個block之內，pFactory已經被釋放了，所以那個destructor的this一點都不可靠，因此要把裡面那個this轉成一個shared_ptr。

enable_shared_from_this

enable_shared_from_this就是因此登場的，他可以把this指標所在的位置轉成一個shared_ptr。
而原先的測試部份也必須用shared_ptr管理了。

class ObjFactory : public enable_shared_from_this<ObjFactory> {
	map<string, weak_ptr<Obj>> lookup_;
	void deleteObj(Obj *pObj)
	{
		lookup_.erase(pObj->name_);
		delete pObj;
	}
public:
	shared_ptr<Obj> get(const string &name)
	{
		auto it = lookup_.find(name);
		if (it != lookup_.end())
		{
			shared_ptr<Obj> obj((it->second).lock());
			return obj;
		}
		shared_ptr<Obj> instance(new Obj(name), bind(&ObjFactory::deleteObj, shared_from_this(), placeholders::_1));
		weak_ptr<Obj> obj(instance);
		lookup_[name] = obj;
		return instance;
	}
};
	{
		shared_ptr<ObjFactory> pFactory(new ObjFactory);
		shared_ptr<Obj> obj1 = pFactory->get("Obj1");
	}

Misc

使用shared_ptr會延長ObjectFactory的LifeCycle，如果pFactory已經不在的話，跟本連清理的動作都不用作。
所以程式可以寫成

class ObjFactory : public enable_shared_from_this<ObjFactory> {
	map<string, weak_ptr<Obj>> lookup_;
	static void deleteObj(const weak_ptr<ObjFactory> &pWeakFactory, Obj *pObj)
	{
		shared_ptr<ObjFactory> pFactory(pWeakFactory.lock());
		if (pFactory) {
			pFactory->lookup_.erase(pObj->name_);
		}
		delete pObj;
	}
public:
	shared_ptr<Obj> get(const string &name)
	{
		auto it = lookup_.find(name);
		if (it != lookup_.end())
		{
			shared_ptr<Obj> obj((it->second).lock());
			return obj;
		}
		shared_ptr<Obj> instance(new Obj(name), bind(&ObjFactory::deleteObj, 
			weak_ptr<ObjFactory>(shared_from_this()), placeholders::_1));
		weak_ptr<Obj> obj(instance);
		lookup_[name] = obj;
		return instance;
	}
};

結論

有本好書真的很重要啊，以前我只會用最粗淺的shared_ptr，對於wear_ptr跟其他特性玩全部熟。有了範例之後至少有個基本認識。
至於程式寫得這麼複雜到令人髮指也是不太好，Garbage collection很大部份可以紓解Programmer的負擔。

yield semantics in C/C++

Posted on 2014-02-09 Edited on 2025-06-15 In C , c++

其他語言已經有yield的語意了，不過C/C++必須手動模擬。
看了Coroutines in C之後，做了一下實驗。

int func()
{
	static int i, state = 0;
	switch (state)
	{
	case 0: goto LABEL0;
	case 1: goto LABEL1;
	}
LABEL0:
	for (i = 0; i < 10; i++) {
		state = 1;
		return i;
LABEL1:;
	}
	return -1;
}

測試VC12、GCC和Clang之後，發現GCC要使用C99模式編譯才會成功。
不過美增加一個狀態就得增加一個LABEL，也是蠻麻煩的一件事，後來看到一個作法更好，之前從沒想過能這樣用。

int func()
{
	static int i, state = 0;
	switch (state)
	{
	case 0:
		for (i = 0; i < 10; i++) {
			state = 1;
			return i;
	case 1:;
		}
	}
	return -1;
}

從沒想過switch/case的statement可以這樣用，開了眼界了。