315 changed files with 960 additions and 7887 deletions
--- a/.gitignore
+++ b/.gitignore
@ -1,14 +1,6 @@
-/documentation/DB
+/03-documentation/DB
-/documentation/library
+/03-documentation/library
-/output
+/04-outputs
 /manuscript/*_files/
 # Elsevier journal target:
 # Ignore bibliography style, spl (for natbib?) and latex class
 # since they don't get deleted after compilation
 *.spl
 *.bst
 *.cls
 # Created by https://www.toptal.com/developers/gitignore/api/-f,python,linux,vim,quarto,markdown,jupyternotebooks
 # Edit at https://www.toptal.com/developers/gitignore?templates=-f,python,linux,vim,quarto,markdown,jupyternotebooks
--- a/00-notebooks/bibmanip.qmd
+++ b/00-notebooks/bibmanip.qmd
@ -1,5 +1,5 @@
 ---
-bibliography: ../data/intermediate/zotero-library.bib
+bibliography: ../02-data/intermediate/zotero-library.bib
 csl: /home/marty/documents/library/utilities/styles/APA-7.csl
 papersize: A4
 linestretch: 1.5
@ -22,8 +22,7 @@ subtitle: Addressing inequalities in the World of Work
 ```{python}
 #| echo: false
 from pathlib import Path
-import src.globals as g
+data_dir=Path("../02-data")
 data_dir = g.DATA_DIR
 ## standard imports
 from IPython.core.display import Markdown as md
@ -44,9 +43,8 @@ sns.set_style("whitegrid")
 import bibtexparser
 bib_string=""
-sample_dir = g.REFERENCE_DATA.joinpath("01_wos-sample_2023-11-02")
+print(f"path: {data_dir.joinpath('raw/01_wos-sample_2023-11-02').absolute()}")
-print(f"path: {sample_dir.absolute()}")
+for partial_bib in data_dir.joinpath("raw/01_wos-sample_2023-11-02").glob("*.bib"):
 for partial_bib in sample_dir.glob("*.bib"):
    with open(partial_bib) as f:
        bib_string+="\n".join(f.readlines())
 sample = bibtexparser.parse_string(bib_string)
--- a/00-notebooks/explore.qmd
+++ b/00-notebooks/explore.qmd
@ -1,5 +1,5 @@
 ---
-bibliography: data/intermediate/zotero-library.bib
+bibliography: 02-data/intermediate/zotero-library.bib
 title: Grab yml
 ---
@ -184,18 +184,23 @@ from matplotlib import pyplot as plt
 import seaborn as sns
 from tabulate import tabulate
 import bibtexparser
 import src.globals as g
 sns.set_style("whitegrid")
 DATA_DIR=Path("./02-data")
 RAW_DATA=DATA_DIR.joinpath("raw")
 WORKING_DATA=DATA_DIR.joinpath("intermediate")
 PROCESSED_DATA=DATA_DIR.joinpath("processed")
 SUPPLEMENTARY_DATA=DATA_DIR.joinpath("supplementary")
 bib_string=""
-for partial_bib in g.REFERENCE_DATA.glob("**/*.bib"):
+for partial_bib in RAW_DATA.glob("**/*.bib"):
    with open(partial_bib) as f:
        bib_string+="\n".join(f.readlines())
 bib_sample_raw_db = bibtexparser.parse_string(bib_string)
 bib_string=""
-for partial_bib in g.REFERENCE_DATA.joinpath("zotero-library.bib"):
+for partial_bib in WORKING_DATA.glob("**/*.bib"):
    with open(partial_bib) as f:
        bib_string+="\n".join(f.readlines())
 bib_sample = bibtexparser.parse_string(bib_string)
@ -217,10 +222,10 @@ zot_df = pd.DataFrame([
 ], columns = ["doi", "cited", "usage", "keywords"]).drop_duplicates("doi").set_index("doi")
 # Add WB country grouping definitions (income group, world region)
-WB_COUNTRY_GROUPS_FILE = Path(f"{g.SUPPLEMENTARY_DATA}/wb-country-groupings.xlsx").resolve()
+WB_COUNTRY_GROUPS_FILE = Path(f"{SUPPLEMENTARY_DATA}/wb-country-groupings.xlsx").resolve()
 df_country_groups = pd.read_excel(WB_COUNTRY_GROUPS_FILE).set_index("Economy")
-bib_df = (load_data.from_yml(f"{g.PROCESSED_DATA}")
+bib_df = (load_data.from_yml(f"{PROCESSED_DATA}")
    .assign(
        doi=lambda _df: _df["uri"].str.extract(r"https?://(?:dx\.)?doi\.org/(.*)", expand=False),
        zot_cited=lambda _df: _df["doi"].map(zot_df["cited"]),
--- a/00-notebooks/main-findings.qmd
+++ b/00-notebooks/main-findings.qmd
@ -15,7 +15,7 @@ import bibtexparser
 sns.set_style("whitegrid")
-DATA_DIR=Path("./data")
+DATA_DIR=Path("./02-data")
 RAW_DATA=DATA_DIR.joinpath("raw")
 WORKING_DATA=DATA_DIR.joinpath("intermediate")
 PROCESSED_DATA=DATA_DIR.joinpath("processed")
@ -120,7 +120,7 @@ datavis:
 ```{python}
-findings_institutional = pd.read_csv("data/supplementary/findings-institutional.csv")
+findings_institutional = pd.read_csv("02-data/supplementary/findings-institutional.csv")
 findings_institutional
 from src.model import validity
 import math
--- a/00-notebooks/rank_validities.qmd
+++ b/00-notebooks/rank_validities.qmd
@ -16,7 +16,7 @@ import bibtexparser
 sns.set_style("whitegrid")
-DATA_DIR=Path("./data")
+DATA_DIR=Path("./02-data")
 RAW_DATA=DATA_DIR.joinpath("raw")
 WORKING_DATA=DATA_DIR.joinpath("intermediate")
 PROCESSED_DATA=DATA_DIR.joinpath("processed")
--- a/00-notebooks/test-magma.qmd
+++ b/00-notebooks/test-magma.qmd
@ -1,5 +1,5 @@
 ---
-bibliography: data/intermediate/zotero-library.bib
+bibliography: 02-data/intermediate/zotero-library.bib
 csl: /home/marty/documents/library/utilities/styles/APA-7.csl
 papersize: A4
 linestretch: 1.5
@ -28,10 +28,8 @@ zotero:
 ```{python}
 #| echo: false
 from pathlib import Path
-import src.globals as g
+DATA_DIR=Path("./02-data")
-DATA_DIR = g.DATA_DIR
+BIB_PATH = DATA_DIR.joinpath("raw/01_wos-sample_2023-11-02")
 RAW_DATA = g.RAW_DATA
 BIB_PATH = g.REFERENCE_DATA.joinpath("01_wos-sample_2023-11-02")
 ## standard imports
 from IPython.core.display import Markdown as md
--- a/02-data/intermediate/zotero-library.bib
+++ b/02-data/intermediate/zotero-library.bib
--- a/02-data/processed/extracted.csv
+++ b/02-data/processed/extracted.csv
--- a/02-data/processed/irrelevant/AlbujaEcheverria2021.DISABLED
+++ b/02-data/processed/irrelevant/AlbujaEcheverria2021.DISABLED
--- a/02-data/processed/irrelevant/Clibborn2022.DISABLED
+++ b/02-data/processed/irrelevant/Clibborn2022.DISABLED
--- a/02-data/processed/irrelevant/Dumas2018.DISABLED
+++ b/02-data/processed/irrelevant/Dumas2018.DISABLED
--- a/02-data/processed/irrelevant/Eckardt2022.yml.DISABLED
+++ b/02-data/processed/irrelevant/Eckardt2022.yml.DISABLED
--- a/02-data/processed/irrelevant/Elveren2013.DISABLED
+++ b/02-data/processed/irrelevant/Elveren2013.DISABLED
--- a/02-data/processed/irrelevant/Mhando2020.DISABLED
+++ b/02-data/processed/irrelevant/Mhando2020.DISABLED
--- a/02-data/processed/irrelevant/Saleh2018.DISABLED
+++ b/02-data/processed/irrelevant/Saleh2018.DISABLED
--- a/02-data/processed/irrelevant/deGeus2022.DISABLED
+++ b/02-data/processed/irrelevant/deGeus2022.DISABLED
--- a/02-data/processed/relevant/Adam2018.yml
+++ b/02-data/processed/relevant/Adam2018.yml
--- a/02-data/processed/relevant/Adams2015.yml
+++ b/02-data/processed/relevant/Adams2015.yml
--- a/02-data/processed/relevant/Ahumada2023.yml
+++ b/02-data/processed/relevant/Ahumada2023.yml
--- a/02-data/processed/relevant/Al-Mamun2014.yml
+++ b/02-data/processed/relevant/Al-Mamun2014.yml
--- a/02-data/processed/relevant/Alexiou2023.yml
+++ b/02-data/processed/relevant/Alexiou2023.yml
--- a/02-data/processed/relevant/Alinaghi2020.yml
+++ b/02-data/processed/relevant/Alinaghi2020.yml
--- a/02-data/processed/relevant/Bailey2012.yml
+++ b/02-data/processed/relevant/Bailey2012.yml
--- a/02-data/processed/relevant/Bartha2020.yml
+++ b/02-data/processed/relevant/Bartha2020.yml
--- a/02-data/processed/relevant/Blumenberg2014.yml
+++ b/02-data/processed/relevant/Blumenberg2014.yml
--- a/02-data/processed/relevant/Broadway2020.yml
+++ b/02-data/processed/relevant/Broadway2020.yml
--- a/02-data/processed/relevant/Cardinaleschi2019.yml
+++ b/02-data/processed/relevant/Cardinaleschi2019.yml
--- a/02-data/processed/relevant/Carstens2018.yml
+++ b/02-data/processed/relevant/Carstens2018.yml
--- a/02-data/processed/relevant/Chao2022.yml
+++ b/02-data/processed/relevant/Chao2022.yml
--- a/02-data/processed/relevant/Cieplinski2021.yml
+++ b/02-data/processed/relevant/Cieplinski2021.yml
--- a/02-data/processed/relevant/Clark2019.yml
+++ b/02-data/processed/relevant/Clark2019.yml
--- a/02-data/processed/relevant/Coutinho2006.yml
+++ b/02-data/processed/relevant/Coutinho2006.yml
--- a/02-data/processed/relevant/Davies2022.yml
+++ b/02-data/processed/relevant/Davies2022.yml
--- a/02-data/processed/relevant/Debowicz2014.yml
+++ b/02-data/processed/relevant/Debowicz2014.yml
--- a/02-data/processed/relevant/Delesalle2021.yml
+++ b/02-data/processed/relevant/Delesalle2021.yml
--- a/02-data/processed/relevant/Dieckhoff2015.yml
+++ b/02-data/processed/relevant/Dieckhoff2015.yml
--- a/02-data/processed/relevant/Dustmann2012.yml
+++ b/02-data/processed/relevant/Dustmann2012.yml
--- a/02-data/processed/relevant/Emigh2018.yml
+++ b/02-data/processed/relevant/Emigh2018.yml
--- a/02-data/processed/relevant/Ferguson2015.yml
+++ b/02-data/processed/relevant/Ferguson2015.yml
--- a/02-data/processed/relevant/Field2019.yml
+++ b/02-data/processed/relevant/Field2019.yml
--- a/02-data/processed/relevant/Gates2000.yml
+++ b/02-data/processed/relevant/Gates2000.yml
--- a/02-data/processed/relevant/Gilbert2001.yml
+++ b/02-data/processed/relevant/Gilbert2001.yml
--- a/02-data/processed/relevant/Go2010.yml
+++ b/02-data/processed/relevant/Go2010.yml
--- a/02-data/processed/relevant/Hardoy2015.yml
+++ b/02-data/processed/relevant/Hardoy2015.yml
--- a/02-data/processed/relevant/Hojman2019.yml
+++ b/02-data/processed/relevant/Hojman2019.yml
--- a/02-data/processed/relevant/Khan2021.yml
+++ b/02-data/processed/relevant/Khan2021.yml
--- a/02-data/processed/relevant/Kuriyama2021.yml
+++ b/02-data/processed/relevant/Kuriyama2021.yml
--- a/02-data/processed/relevant/Li2022.yml
+++ b/02-data/processed/relevant/Li2022.yml
--- a/02-data/processed/relevant/Liyanaarachchi2016.yml
+++ b/02-data/processed/relevant/Liyanaarachchi2016.yml
--- a/02-data/processed/relevant/Militaru2019.yml
+++ b/02-data/processed/relevant/Militaru2019.yml
--- a/02-data/processed/relevant/Mukhopadhaya2003.yml
+++ b/02-data/processed/relevant/Mukhopadhaya2003.yml
--- a/02-data/processed/relevant/Mun2018.yml
+++ b/02-data/processed/relevant/Mun2018.yml
--- a/02-data/processed/relevant/Pi2016.yml
+++ b/02-data/processed/relevant/Pi2016.yml
--- a/02-data/processed/relevant/Poppen2017.yml
+++ b/02-data/processed/relevant/Poppen2017.yml
--- a/02-data/processed/relevant/Rendall2013.yml
+++ b/02-data/processed/relevant/Rendall2013.yml
--- a/02-data/processed/relevant/Rosen2014.yml
+++ b/02-data/processed/relevant/Rosen2014.yml
--- a/02-data/processed/relevant/Shepherd-Banigan2021.yml
+++ b/02-data/processed/relevant/Shepherd-Banigan2021.yml
--- a/02-data/processed/relevant/Shin2006.yml
+++ b/02-data/processed/relevant/Shin2006.yml
--- a/02-data/processed/relevant/SilveiraNeto2011.yml
+++ b/02-data/processed/relevant/SilveiraNeto2011.yml
--- a/02-data/processed/relevant/Sotomayor2021.yml
+++ b/02-data/processed/relevant/Sotomayor2021.yml
--- a/02-data/processed/relevant/Standing2015.yml
+++ b/02-data/processed/relevant/Standing2015.yml
--- a/02-data/processed/relevant/Stock2021.yml
+++ b/02-data/processed/relevant/Stock2021.yml
--- a/02-data/processed/relevant/Suh2017.yml
+++ b/02-data/processed/relevant/Suh2017.yml
--- a/02-data/processed/relevant/Thoresen2021.yml
+++ b/02-data/processed/relevant/Thoresen2021.yml
--- a/02-data/processed/relevant/Wang2016.yml
+++ b/02-data/processed/relevant/Wang2016.yml
--- a/02-data/processed/relevant/Wang2020.yml
+++ b/02-data/processed/relevant/Wang2020.yml
--- a/02-data/processed/relevant/Whitworth2021.yml
+++ b/02-data/processed/relevant/Whitworth2021.yml
--- a/02-data/processed/relevant/Wong2019.yml
+++ b/02-data/processed/relevant/Wong2019.yml
--- a/02-data/processed/relevant/Xu2021.yml
+++ b/02-data/processed/relevant/Xu2021.yml
--- a/data/references/db/01_wos-sample_2023-11-02/wos_01.bib
+++ b/data/references/db/01_wos-sample_2023-11-02/wos_01.bib
--- a/data/references/db/01_wos-sample_2023-11-02/wos_02.bib
+++ b/data/references/db/01_wos-sample_2023-11-02/wos_02.bib
--- a/02-data/raw/02_snowballing-starts/Bishu2017/119-of-126
+++ b/02-data/raw/02_snowballing-starts/Bishu2017/119-of-126
--- a/02-data/raw/02_snowballing-starts/Bishu2017/DOIs.txt
+++ b/02-data/raw/02_snowballing-starts/Bishu2017/DOIs.txt
--- a/02-data/raw/02_snowballing-starts/Bishu2017/DOIs_only.txt
+++ b/02-data/raw/02_snowballing-starts/Bishu2017/DOIs_only.txt
--- a/02-data/raw/02_snowballing-starts/Bishu2017/references.txt
+++ b/02-data/raw/02_snowballing-starts/Bishu2017/references.txt
--- a/02-data/raw/02_snowballing-starts/Chamhuri2012/10-of-26
+++ b/02-data/raw/02_snowballing-starts/Chamhuri2012/10-of-26
--- a/02-data/raw/02_snowballing-starts/Chamhuri2012/DOIs.txt
+++ b/02-data/raw/02_snowballing-starts/Chamhuri2012/DOIs.txt
--- a/02-data/raw/02_snowballing-starts/Chamhuri2012/DOIs_only.txt
+++ b/02-data/raw/02_snowballing-starts/Chamhuri2012/DOIs_only.txt
--- a/02-data/raw/02_snowballing-starts/Chamhuri2012/references.txt
+++ b/02-data/raw/02_snowballing-starts/Chamhuri2012/references.txt
--- a/02-data/raw/02_snowballing-starts/Chang2021/23-of-26
+++ b/02-data/raw/02_snowballing-starts/Chang2021/23-of-26
--- a/02-data/raw/02_snowballing-starts/Chang2021/DOIs.txt
+++ b/02-data/raw/02_snowballing-starts/Chang2021/DOIs.txt
--- a/02-data/raw/02_snowballing-starts/Chang2021/DOIs_only.txt
+++ b/02-data/raw/02_snowballing-starts/Chang2021/DOIs_only.txt
--- a/02-data/raw/02_snowballing-starts/Chang2021/references.txt
+++ b/02-data/raw/02_snowballing-starts/Chang2021/references.txt
--- a/02-data/raw/02_snowballing-starts/Crowther2001/17-of-27
+++ b/02-data/raw/02_snowballing-starts/Crowther2001/17-of-27
--- a/02-data/raw/02_snowballing-starts/Crowther2001/DOIs.txt
+++ b/02-data/raw/02_snowballing-starts/Crowther2001/DOIs.txt
--- a/02-data/raw/02_snowballing-starts/Crowther2001/DOIs_only.txt
+++ b/02-data/raw/02_snowballing-starts/Crowther2001/DOIs_only.txt
--- a/02-data/raw/02_snowballing-starts/Crowther2001/references.txt
+++ b/02-data/raw/02_snowballing-starts/Crowther2001/references.txt
--- a/02-data/raw/02_snowballing-starts/Curran2022/103-of-129
+++ b/02-data/raw/02_snowballing-starts/Curran2022/103-of-129
--- a/02-data/raw/02_snowballing-starts/Curran2022/DOIs.txt
+++ b/02-data/raw/02_snowballing-starts/Curran2022/DOIs.txt
--- a/02-data/raw/02_snowballing-starts/Curran2022/DOIs_only.txt
+++ b/02-data/raw/02_snowballing-starts/Curran2022/DOIs_only.txt
--- a/02-data/raw/02_snowballing-starts/Curran2022/references.txt
+++ b/02-data/raw/02_snowballing-starts/Curran2022/references.txt
--- a/02-data/raw/02_snowballing-starts/Duflo2012/57-of-88
+++ b/02-data/raw/02_snowballing-starts/Duflo2012/57-of-88
--- a/02-data/raw/02_snowballing-starts/Duflo2012/DOIs.txt
+++ b/02-data/raw/02_snowballing-starts/Duflo2012/DOIs.txt
--- a/02-data/raw/02_snowballing-starts/Duflo2012/DOIs_only.txt
+++ b/02-data/raw/02_snowballing-starts/Duflo2012/DOIs_only.txt
--- a/02-data/raw/02_snowballing-starts/Duflo2012/references.txt
+++ b/02-data/raw/02_snowballing-starts/Duflo2012/references.txt
--- a/02-data/raw/02_snowballing-starts/Finlay2021/126-of-136
+++ b/02-data/raw/02_snowballing-starts/Finlay2021/126-of-136
--- a/02-data/raw/02_snowballing-starts/Finlay2021/DOIs.txt
+++ b/02-data/raw/02_snowballing-starts/Finlay2021/DOIs.txt
--- a/02-data/raw/02_snowballing-starts/Finlay2021/DOIs_only.txt
+++ b/02-data/raw/02_snowballing-starts/Finlay2021/DOIs_only.txt
--- a/02-data/raw/02_snowballing-starts/Finlay2021/references.txt
+++ b/02-data/raw/02_snowballing-starts/Finlay2021/references.txt
--- a/02-data/raw/02_snowballing-starts/Fortune2022/13-of-18
+++ b/02-data/raw/02_snowballing-starts/Fortune2022/13-of-18
--- a/Show more
+++ b/Show more